一周AIGC丨 Pika Labs 完成 5500 万美元融资,国内首套 AIGC 汉服亮相

95后女生创立的AI视频生成工具Pika Labs在上周刷屏,4人团队,成立半年就获得5500万美元融资,估值2亿美元。同时也在A股上演了“父凭女贵”的戏码,其父亲所在的上市公司在这款工具爆火后连续收获3个涨停。国内首套完全用 AIGC 设计的汉服成衣亮相第十七届杭州文博会,AIGC在影视行业有了用武之地。导演借助无界 AI,可以很直观地生成自己想要的东西,给到需要沟通的部门,大大节省了沟通成本。

图片来源:由无界AI 生成
图片来源:由无界AI 生成


融资


生成式 AI 初创公司 Together AI 获超 1 亿美元 A 轮融资

据 AIGC 开放社区报道,11 月 30 日,开源生成式 AI 平台 Together AI 在官网宣布,获得 1.025 亿美元(约 7.3 亿元)A 轮融资。本次由凯鹏华盈(Kleiner Perkins)领投,英伟达、Emergence Capital、NEA、Prosperity 7、Greycroft 等跟投。

生成式 AI 初创公司 Pika Labs 完成 5500 万美元融资,并推出视频生成器 Pika 1.0

据 The Decoder 11 月 29 日报道,生成式 AI 初创公司 Pika Labs 在由 Nat Friedman 和 Daniel Gross 领投的前种子轮和种子轮融资以及由 Lightspeed Venture Partners 领投的 A 轮融资中筹集了 5500 万美元。其他投资者包括 Adam D'Angelo(Quora 创始人兼首席执行官)、Andrej Karpathy、Clem Delangue(Hugging Face 联合创始人兼首席执行官以及 Factorial Capital 合伙人)和 Craig Kallman(Atlantic Records 首席执行官)。

此外,Pika Labs 宣布推出视频生成器 Pika 1.0。据悉,Pika 1.0 采用了全新的人工智能模型,可以生成和编辑三维动画、动漫、卡通和电影等不同风格的视频。

AI 生成工具 HeyGen 完成 560 万美元融资

AI 新智界讯,11 月 29 日,AI 生成工具 HeyGen 在社交平台 X 上宣布,获得 560 万美元的新风险投资,由 SarahGuo 的 Conviction Partners 领投。该公司本轮融资估值为 7500 万美元。此外,HeyGen 表示,其 ARR(年度经常性收入)已在一年内从 100 万美元增长到 1800 万美元,并推出 Instant Avatar(Avatar 2.0)。

生物技术和 AI 初创公司 Cradle 获 2400 万美元 A 轮融资

据 TechCrunch 11 月 28 日报道,继去年完成 550 万美元的种子轮融资后,生物技术和人工智能初创公司 Cradle 获得 2400 万美元 A 轮融资,此前投资者 Index Ventures 领投,Kindred Capital(也是种子轮投资者)以及 Chris Gibson、Tom Glocer 等个人投资者参投,新资金将用于发展团队和销售。

“海纳 AI”完成数千万元 A 轮融资,联想创投独家投资

据 36 氪 12 月 1 日报道,“海纳 AI”近日完成数千万元 A 轮融资,由联想创投独家投资,本轮融资资金将用于人才招募、AI 模型研发、营销体系搭建。据了解,“海纳 AI”是北京群星闪耀科技有限公司旗下的人才招聘垂直领域 AI 产品,最早于 2019 年推出,专攻 AI 面试服务,帮助企业借助 AI 技术完成招聘面试环节。


大模型


哈尔滨工业大学(深圳)发布多模态大模型“九天”

据站长之家 12 月 4 日报道,哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在 13 个视觉语言任务上的 state-of-the-art 性能,尤其在 Visual Spatial Reasoning 任务上实现了 5% 的性能提升。

智源研究院正式开源 700 亿参数大模型 Aquila2-70B-Expr

据 36 氪 11 月 30 日报道,北京智源人工智能研究院副院长兼总工程师林咏华在 2023 人工智能计算大会上宣布,正式开源 700 亿参数大模型 Aquila2-70B-Expr(异构先驱版),这是首个基于英伟达混合资源及天数智芯混合资源完成训练的大模型。

据介绍,此次基于 FlagScale v0.2 分别在英伟达混合资源(A100 集群 + A800 集群)、天数智芯混合资源(BI-V100 集群 + BI-V150 集群)完成了 Aquila2-70B-Expr 大模型训练工作。

浪潮信息发布千亿级开源大模型“源 2.0”

据钛媒体 11 月 27 日报道,浪潮信息正式发布千亿级开源大模型“源 2.0”。源 2.0 采用 LFA(Localized Filtering-based Attention)局部依赖的自注意力机制,可有效捕捉局部信息和短序列信息,使得模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式和编程能力。

复旦保险团队发布“保险智酷”保险领域专用大模型

据《科创板日报》12 月 2 日报道,复旦保险红人节暨“保险智酷”大模型发布会召开,由复旦保险团队研发的保险垂直大模型“保险智酷”在会上发布。据介绍,“保险智酷”是为保险场景下的各类用户提供专业、智能、全面的数字化服务的保险领域专用大语言模型。

阿里云开源通义千问 720 亿参数模型

据金十 12 月 1 日消息,阿里云开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio。据悉,阿里云本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit/8bit 量化版模型,便于开发者们推理训练。

腾讯、南洋理工等开源图表羊驼大模型 ChartLlama

据机器之心消息,近期,腾讯联合南洋理工大学、东南大学提出了 ChartLlama。研究团队创建了一个高质量图表数据集,并训练了一个专注于图表理解和生成任务的多模态大型语言模型。ChartLlama 结合了语言处理与图表生成等多重性能,为科研工作者和相关专业人员提供了一个强大的研究工具。

幻方量化旗下 DeepSeek 发布 67B 大模型

AI 新智界讯,11 月 29 日,知名私募巨头幻方量化官方宣布,其探索 AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继 11 月初发布 Coder 代码模型之后,正式发布通用大语言模型“DeepSeek LLM 67B”。模型已完全开源,同时服务已经全面开放内测。

DeepSeek 称,相比开源的同级别模型 LLaMA2 70B,DeepSeek LLM 67B 在近 20 个中英文的公开评测榜单上表现更佳,尤其突出的是推理、数学、编程等能力。

Stability AI 推出 Stable Diffusion XL Turbo 模型

据 IT 之家 11 月 30 日报道,Stability AI 日前推出了 Stable Diffusion XL Turbo(SDXL Turbo),为此前 SDXL 模型的改进版本,号称采用了“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”,将图片生成迭代步骤从原先的 50 步减少至 1 步,据称“仅仅进行一次迭代步骤就能生成高品质图像”。

据悉,Stable Diffusion XL Turbo 模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量。实验结果显示,Stable Diffusion XL Turbo 在大幅降低运算需求的同时,仍可以保持良好的图像生成品质,该模型单词迭代,即胜过 4 次迭代的 LCM-XL,而 4 次迭代的 Stable Diffusion XL Turbo 就可击败此前经过 50 步迭代配置的 Stable Diffusion XL;在 A100 GPU 上,计算 512 x512 分辨率的图像,只需 207 毫秒。

谷歌发布 Translatotron 3 模型,可绕过文本转换步骤

据 IT 之家消息,谷歌正式介绍推出了名为 Translatotron 3 的新 AI 模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。

谷歌于 2019 年推出了 Translatotron S2 ST 系统,于 2021 年 7 月推出第 2 个版本,在 2023 年 5 月 27 日发布的一篇论文中,宣布正在部署新方法,训练 Translatotron 3。研究人员称,Translatotron 2 已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而 Translatotron 3 实现“第一个完全无监督直接语音到语音翻译的端对端模型”。


应用


亚马逊推出多项 AI 工具,包括 Titan 系列 AI 模型等

据 VentureBeat 11 月 30 日报道,继推出名为 Amazon Q 的新型聊天机器人,升级款 AI 系统处理器 Trainium2,并与英伟达拓展伙伴关系外,亚马逊 AWS 数据与人工智能副总裁 Swami Sivasubramanian 昨日在 re: Invent 大会上又公布了一系列新的 AI 工具。其中包括三款“Titan”系列生成式 AI 模型:Titan Image Generator、Titan Text Express 和 Titan Text Lite。此外,Amazon Bedrock 也迎来升级,可为企业客户提供了对市面上大多数模型的访问权限,包括 AI21 的 Jurassic、Anthropic 的 Claude 2.1、Meta 的 Llama 2 和 Stable Diffusion。

国内首套完全用 AIGC 设计的汉服成衣亮相第十七届杭州文博会

AI 新智界讯,11 月 23 日至 27 日,第十七届杭州文化创意产业博览会在杭州成功举办。在此期间,国内首套完全用 AIGC 设计创作的汉服成衣在展会上亮相。这件汉服的设计源自 2023 年“梦溪杯”宋韵文化创新大赛的优秀作品《饰韵西子》,由参赛者李超使用无界 AI 创作完成。该作品的灵感来自四种中国传统配色——鞠衣、杨妃、青莲、翠微,并由无界 AI 和宋韵汉服大模型搭配工笔人物、勾线水彩等 LORA 创作而成。

字节跳动在海外上线大模型产品“ChitChop”

据 Tech 星球 11 月 29 日报道,字节在海外上线了一款名为“ChitChop”的大模型产品,开发运营公司是 POLIGON,字节旗下海外社交产品 Helo 同样由该公司运营,目前已上线独立 App 和网页版。

据悉,ChitChop 是一个人工智能助理工具,可以为用户提供多达 200 + 的智能机器人服务,通过提供创造性灵感、提高工作效率等方式来服务用户的工作和生活。值得注意的是,这款产品与抖音集团旗下 AI 产品“小悟空”类似,都是基于云雀大语言模型创建的 AI 工具合集。

魅族发布大模型 Aicy AI,支持问答、绘画等多项 AI 功能

据快科技 11 月 30 日报道,魅族今日官宣发布 Flyme 10.5 系统和自家大模型 Aicy AI。据介绍,Aicy AI 是即问即答的百科全书,拥有海量知识的 Aicy 能回答自然科学、生活知识、健康常识、情感问答等各类问题。另外,Aicy 还支持创意灵感生成画作,可以生成写实风、二次元、水墨风等各种风格的画作。此外,图库还新增了 AI 写真功能。用户上传照片后,AI 就能生成其写真照片。

谷歌 DeepMind 利用 AI 工具 GNoME 发现 220 万种新晶体材料

AI 新智界讯,11 月 30 日,谷歌 DeepMind 在《自然》期刊上展示了 AI 工具 GNoME,并介绍了 AI 在材料科学上的相关应用。据悉,DeepMind 使用 GNoME 发现了 220 万种新晶体,其中有 38 万种晶体属于稳定材料,可以在实验室制造,有望应用在电池或是超导体等方面。DeepMind 声称,如果仅凭借人力计算出这些材料,需要花费 800 年。

阿里国际发布 3 款 AI 设计生态工具

据《科创板日报》12 月 1 日报道,在第六届中国国际工业设计博览会上,阿里国际发布了 3 款设计生态工具:堆友、PicCopilot、鹿班 AI。据介绍,这 3 款产品具有 AI 绘画、AI 模型创作、AI 图像和视频处理等功能,目前已经服务数十万商家、覆盖 50 万设计师。

Freepik 推出 Pikaso 实时 AI 绘图工具 采用 LCM 绘图技术,简单线条即可成图

据站长之家 12 月 1 日 消息,近日,知名图库平台 Freepik 发布了其创新产品——Pikaso 实时绘图工具,结合 LCM 技术与百万级图库,为用户带来了全新的创作体验。Pikaso 采用前沿的 LCM 绘图技术,结合 Freepik 的数百万授权图库,使在线实时绘图成为可能。

韩媒:三星 Galaxy Book 4 系列笔记本 12 月 15 日发布,将支持本地运行高斯 AI 大模型

据 IT之家援引韩联社报道,有业内人士透露称,三星电子将于本月 15 日推出搭载英特尔下一代处理器酷睿 Ultra 的 Galaxy Book 4 系列笔记本电脑,号称是全球首款 AI 笔记本。

报道称,Galaxy Book 4 相比上一代产品要提早一个半月亮相。这次之所以选择更早发布,是因为三星需要体现这款新品作为“首款 AI 笔记本”的象征意义。Galaxy Book 4 有望搭载其自研的 AI 大模型“高斯”(Samsung Gauss),设备无需将收集到的信息传输到中央服务器,这意味着该笔记本内置的“高斯”将支持本地运行。

华硕将发布首款英特尔酷睿 Ultra 处理器 AI 笔记本

AI 新智界讯,ASUS 华硕今日在微博上宣布,2024 华硕酷睿 Ultra AI PC 轻薄本新品发布会将在 12 月 15 日 15:00 举行,届时华硕灵耀系列笔记本新品也将登场。华硕称,这是首台最新酷睿 Ultra 笔记本电脑。


观点


比尔・盖茨:生成式 AI 已达极限,下一个突破是可解释 AI

据《科创板日报》11 月 27 日报道,比尔・盖茨表示,OpenAI 内部包括奥特曼在内的很多人都相信 GPT-5 将明显优于 GPT-4。但他认为,有很多理由相信,当前生成式人工智能已经达到极限。下一个突破盖茨认为是可解释 AI,但预计要到下一个十年(2030-2039)才能实现。

中国科学院院士徐宗本:大模型研究目前与科学化相去甚远

据界面新闻报道,中国科学院院士徐宗本在 CCF 中国软件大会上表示,大模型作为人工智能发展新浪潮的趋势,对于科研范式、生产方式、工业模式的革命性影响不可低估,投入大模型研究已是必然选择。但他同时表示,大模型研究目前仍属于工程化,与科学化相去甚远。

他认为,软件将成为人工智能最先突破的领域,“软件有语言,语言有语法,语法有严格的标准,人工智能只要能够规范化、有逻辑边界,就能在软件领域做得好。”

Hugging Face 联创发布 2024 年预测:开源 LLM 将达到最好的闭源 LLM 水平

AI 新智界讯,11 月 27 日,AI 开源社区 Hugging Face 联合创始人兼首席执行官 Clement Delangue 发帖对 2024 年行业的发展做了 6 条预测,包括: 一家当红 AI 公司会倒闭,或者以极低的价格被收购;开源 LLM 将达到最好的闭源 LLM 水平;AI 在视频、时间序列、生物和化学领域取得重大突破; 大众将更进一步关心 AI 在经济上和环境上的成本; 某个流行媒体的大多数内容将由 AI 生成; Hugging Face 上 1000 万人工智能开发者不会导致失业增加。

北京智源人工智能研究院林咏华:国内 AI 芯片的大模型训练性能与国外约有三年差距

据《科创板日报》11 月 29 日报道,北京智源人工智能研究院副院长、总工程师林咏华表示,当前中国 AI 芯片的大模型集群训练性能,只有个别接近英伟达 A100/A800,大多数不到 50%。此外是生态差距巨大,我国 AI 芯片公司有 40 余家,但中国 AI 芯片整体的市场占有率加起来不超过 10%,各家 AI 芯片软件各异、生态十分零碎割裂。

马云:AI 电商时代刚刚开始,对谁都是机会、也是挑战

据《科创板日报》11 月 29 日报道,从多名阿里内部人士处了解到,针对员工对于昨晚拼多多财报和电商等的讨论,马云在阿里内网罕见地参与了谈论并发言。马云称,请大家多提建设性意见和建议,特别是创新想法。他相信今天的阿里人大家都在看都在听,更坚信阿里会变,阿里会改。所有伟大的公司都诞生在冬天里。AI 电商时代刚刚开始,对谁都是机会,也是挑战。马云还说,要祝贺拼多多过去几年的决策,执行和努力。“谁都牛过,但能为了明天后天牛而改革的人,并且愿意付出任何代价和牺牲的组织才令人尊重。回到我们的使命和愿景,阿里人,加油!”

Meta 首席科学家杨立昆驳黄仁勋:超智能不会很快到来

据 IT 之家 12 月 4 日报道,英伟达首席执行官黄仁勋不久前宣称,超级人工智能(AI)将在五年内赶超人类。对此,Facebook 母公司 Meta 首席科学家、深度学习先驱杨立昆(Yann LeCun)的观点截然相反。他认为,超智能不会很快到来。

杨立昆表示,目前的人工智能系统还需要几十年的时间才能达到某种意义上的类人感知能力。届时,这些具备常识的人工智能系统更加强大,不再仅仅限于以创造性的方式总结堆积如山的文本。对于黄仁勋的观点,杨立昆评论道:“我了解黄仁勋,这位英伟达首席执行官从人工智能热潮中获益良多。这是一场人工智能战争,而它在提供武器。”


研报


研究:GPT-4 在医学问题上击败了专业调优的 MedPaLM 2 模型

据站长之家 12 月 4 日报道,微软研究人员展示了 GPT-4 在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的 MedPaLM2。

研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。Medprompt 方法采用了多种提示工程技术,包括 GPT-4 生成的思维链推理和生成多个单独评分的回答,然后将最高分的答案返回给用户。尽管这种方法会增加推理的成本,因为生成了更多的标记,但结果表明,将领先的通用模型(如 GPT-4)与高级提示工程技术相结合,以评估最新性能的标准,可能是值得考虑的。

研究称:生成一张AI图像所消耗能源相当于给手机充满电

据站长之家 12 月 1 日 消息,根据 AI 初创公司 Hugging Face 和卡内基梅隆大学的研究人员进行的一项新研究,每次使用 AI 生成图像、撰写电子邮件或向聊天机器人提问,都会对地球造成一定的负担。

实际上,使用强大的 AI 模型生成一张图像所消耗的能源相当于给手机充满电,该研究首次计算了使用 AI 模型进行不同任务所产生的碳排放。然而,他们发现使用 AI 模型生成文本的能源消耗明显较低。生成1,000次文本只消耗相当于手机充电量的16% 的能源。