AI创投周报是阿尔法公社推出的聚焦于以天生式AI为代表的人为智能新海潮的创投资讯周报。阿尔法公社浮现和投资出多创业者(Alpha Founders),坚信出多创业者们正在技艺、贸易和社会方面的庞杂鞭策力,他们指引着创投生态的风向。
OpenAI今天颁布Responses API及其配套器材,Responses API内置三大主题功效:搜集搜求器材可及时获取搜集讯息并标注出处,正在SimpleQA基准测试中切确率达90%;文献搜求器材维持多方式文档检索与元数据过滤,帮力客服、执法等场景使用;估计机利用器材则通过模仿人机交互完毕主动化操作,正在OSWorld等测试平台创下38.1%的得胜率新记录。
OpenAI同步推出Agents SDK和Observability Tools,构修起涵盖单/多智能体处事流编排与实行监控的无缺生态。值得留心的是,Responses API采用透后订价形式,搜集搜求、文献搜求等器材按圭臬费率计费,同时答允用户数据仅用于效劳而不会默认用于模子演练。为保证技艺安定,研发团队针对估计机利用器材举办了红队测试,并设立了防提示注入等多重防护机造。
Anthropic推出的MCP(Model Context Protocol)契约旨正在简化AI智能体与表部器材和数据源的连结格式。
Anthropic通过MCP授予了Claude模子正在器材挪用和表部数据拜访方面,的明显的上风。MCP维持双向通讯,雷同于WebSockets,使得AI模子既能获取讯息,也能及时触发操作。与古板API比拟,MCP的集效果力大幅提拔,越发是正在面临大批AI帮手和表部器材时。
其余,MCP还内置了拜访独揽机造和圭臬化的安定施行,确保了编造的安定性和合规性。MCP的矫健性使其既可能正在云端运转,也可能正在当地设置上安放,符合性极强。总的来说,MCP为AI帮手和表部编造之间架设了一条高速途,代替了过去必要技艺职员手工搭修的低效形式,极大地鞭策了AI智能体的繁荣。
斯坦福大学的李飞飞团队正在“保姆型”机械人范围得到了新冲破,提出了一种名为“行动机械人套件”(Behavior Robot Suite, BRS)的归纳框架,旨正在让机械人更自决、更牢靠地实行平常家务做事。
该团队由李飞飞带领,成员包含Yunfan Jiang、Ruohan Zhang等。他们的商量聚焦于处置机械人正在家庭境况中实行多样化做事时面对的离间,越发是全身操作和视觉-运动计谋研习方面的困难。
BRS框架的主题立异包含JoyLo和WB-VIMA。JoyLo是一种低本钱、全身长途操作界面,旨正在完毕对高自正在度搬动呆滞臂的流利独揽,并为计谋研习供应高质料的数据。
WB-VIMA则是一种仿效研习算法,通过自留心力机造动态群集多模态考核,确保机械人闭节之间的无误调和,从而完毕更同步的全身运动。
商量团队通过五项代表性家务做事(如倒垃圾、拾掇衣物、刷马桶等)映现了BRS的本领,全豹做事均正在确切境况中达成,且WB-VIMA正在全豹测试中均平静超越基准手段。
谷歌DeepMind今天推出了两款基于Gemini2.0的具身智能模子——Gemini Robotics和Gemini Robotics-ER,旨正在为新一代适用机械人奠定基本。这两款模子正在泛化本领、交互性和聪颖性上得到了明显冲破,可以帮帮机械人剖判繁复境况并实行细密做事。
Gemini Robotics是一款高级的VLA(视觉-言语-手脚)模子,通过扩展物理手脚行为输格表式,直接独揽机械人达成多举措做事,如折纸、打包饭盒等。而Gemini Robotics-ER则具备高级空间剖判本领,答允机械人愚弄Gemini的具身推理本领,识别物体并实行相应手脚。这两款模子不单合用于双臂机械人平台,还能适配种种形式的机械人,体现了壮健的多形式符合本领。
Gemini Robotics正在泛化性基准测试中的发扬比其他顶尖VLA模子均匀超出一倍多,可以符合新情形并处置未见过的做事。其余,它还能剖判平常对话言语指令,并继续考核四周境况,调理手脚以符合转化。这种可控性使得机械人正在家庭和处事地点中与人类更好地团结。
智元机械人今天颁布了双重惊喜:Vision-Language-Latent-Action (ViLLA) 架构和通器材身基座大模子GO-1。这一颁布标记着机械人正在认知与手脚演练上的庞大冲破。
智元机械人通过划分机械人的演练数据为四个方针,处置了古板VLA架构依赖真机和合成数据的限定性,使得机械人可以更有用地愚弄人类操作视频等珍贵数据源,下降迭代本钱,加快进化。
ViLLA架构通过预测Latent Action Tokens(隐式手脚象征),使机械人可以将人类手脚视频转化为可实行的手脚序列,从而同时得到认知和手脚两个维度的演练。
基于ViLLA架构,智元打造了通器材身基座大模子GO-1,它由VLM(言语视觉模子)和MoE构成,整合了视觉、言语、手脚、触觉等多模态输入,筹划的确手脚,直接输出机械人的手脚实行序列。
GO-1大模子融会贯串了机械人演练数据的四个方针,帮帮机械人达成总共的“基本哺育”和“职业哺育”,具备壮健的转移研习本领,可以急速符合新场景和新做事。实践结果显示,GO-1正在五种分歧繁复度做事上的得胜率大幅当先,均匀得胜率升高了32%。
何恺明与Yann LeCun联手提出了一种名为DYT(Dynamic Tanh)的新技艺,旨正在取代Transformer中的归一化层。这一立异成绩已入选CVPR 2025,并映现了正在不阵亡功能的条件下明显加快模子演练和推理的潜力。
DYT通过单纯的元素级运算完毕归一化结果,避免了古板归一化层中耗时的群集操作。实践阐明,DYT正在多种做事和模子架构中均发扬精采,越发正在LLaMA 7B模子上,推理和演练时代辞别削减了52.4%和42.2%。这一技艺不单提拔了效力,还验证了原始Transformer只是浩瀚等效神经机闭中的一种,为异日的神经搜集策画供应了新的思绪。DYT的代码库已开源,便于商量者和开采者复现和扩展这一成绩。
卡内基梅隆大学(CMU)和滑铁卢大学的华人学者团队今天提出了一种全新的“批判式微调”(Critique Fine-Tuning, CFT)手段,旨正在提拔狂言语模子正在繁复推理做事中的发扬。该商量由Yubo Wang、Xiang Yue和Wenhu Chen三位学者主导,联系论文已公然采表。
CFT的主题绪念是让模子学会批判,而不单仅是仿效。与古板的SFT手段分歧,CFT正在演练经过中为毛病反映供应责备,使模子可以识别并校正反映中的缺陷。
实践阐明,CFT正在仅利用50000个样本举办演练的情形下,其功能优于利用横跨200万个样本的深化研习手段。比方,正在数学推理做事中,CFT演练的模子切确率均匀超出SFT模子4-10个百分点,且演练效力更高,收敛速率更疾。其余,CFT演练的模子正在功能上以至可以与参数目更大的模子相媲美,同时大幅下降了估计本钱。
谷歌为Gemini 2.0 Flash解禁了图像天生功效,这使得它的全模态模子完毕了新的冲破。Gemini 2.0 Flash不单维持原生图像天生,还能通过天然言语提示举办对话式编纂,极大地简化了图像措置流程。开采者现正在可能通过Gemini API和Google AI Studio的实践版本利用这一功效。
Gemini 2.0 Flash的特别之处正在于其超强的推理本领,可以连接实际全国的学问天生更适合上下文的图像,剖判更多细节,并坚守文明配景特质。其余,它还能同时输出文本和插图,坚持惊人的相同性。
这一技艺的得胜颁布,使得谷歌正在与OpenAI的逐鹿中攻陷了先机。OpenAI固然早正在8个月前就映现了全模态图像天生技艺,但至今尚未颁布联系产物。
埋头于细密工业机械人研发的Dexterity今天达成由Lightspeed Venture Partners和Sumitomo领投的9500万美元的新融资,投后估值16.5亿美元。
Dexterity由斯坦福大学博士Samir Menon创立,埋头于开采“类人”细密工业机械人,旨正在处置栈房和工场中反复且损害的做事,如装载箱子和分拣包裹。公司采用特意的AI模子,每个模子埋头于一项特定做事,以升高效力和无误度。
目前,Dexterity的客户包含FedEx和UPS等出名物流公司。创始人Menon示意,这些机械人不单可以提拔处事效力,还能明显下降人为操作的危机。
2.AI医疗公司Ataraxis AI达成2040万美元A轮融资,由AIX Ventures领投
美国AI病理学医疗公司Ataraxis AI达成2040万美元A轮融资,由AIX Ventures领投,参投方包含Thiel Bio、Founders Fund、Floating Point、贝塔斯曼投资,以及既有投资者Giant Ventures和Obvious Ventures。此轮融资将用于加快Ataraxis Breast的贸易化落地、扩展其他癌症类型预测器材开采,以及下一代AI模子的研发。
Ataraxis AI由医学博士Jan Witowski和机械研习专家Krzysztof Geras笼络创立,并获Meta首席AI科学家Yann LeCun控造技艺参谋。公司脱胎于纽约大学,主题团队连接了医学影像与AI技艺研发配景,极力于通过人为智能刷新癌症预后预测和诊治计划遴选。
其主题技艺Kestrel是基于Vision Transformer的泛癌AI基本模子,通过分解数亿张数字病理切片图像块,揭示古板分子检测难以浮现的繁复生物标记物,从而供应更精准的复发危机评分。
目前,它的首款产物Ataraxis Breast已通过临床验证,这是环球首个针对乳腺癌的AI原生预后/预测平台。该平台通过整合病理图像特质与临床数据(如癌症分期、受体状况等),天生0-1分的复发危机评分。商量显示,其预测切确率比现行圭臬检测Oncotype DX(分子检测)超出30%,并能将中危机患者从新分类为低/高危机组,削减不需要的化疗。
3.AI医疗文书公司Freed达成3000万美元A轮融资,Sequoia Capital领投
Freed达成3000万美元A轮融资,Sequoia Capital领投,Scale Venture Partners、Daniel Gross等跟投。此轮资金将用于扩展产物功效(如智能编码与主动化账单),以及拓展家庭医学、妇产科等新专科范围。
Freed埋头于AI医疗文书主动化,由前Facebook工程师Erez Druk与Andrey Bannikov笼络创立。其主题产物为AI语音记载编造,旨正在通过及时记载医患对话并主动天生圭臬化病历,大幅削减临床大夫的文书掌管。
目前,该平台已维持神经病学、急诊医学等6大专科的差别化模板,并完毕与主流电子病历编造(EHR)的无缝集成。截至2025年2月,Freed效劳环球1.7万名大夫,每月措置200万患者病例,将单次文书措置时代从15分钟压缩至2分钟。
AI品牌代办平台Firsthand达成由Radical Ventures领投的2600万美元A轮融资,FirstMark Capital、Aperiam Ventures等跟投。
Firsthand埋头于通过AI品牌代办平台重塑营销生态。该公司开采的处置计划答允营销商和出书商创修自决运转的AI代办,这些代办可以直接与消费者互动,既可安放正在自少见字资产中,也可行为付费媒体分发至表部平台。
其主题技艺上风正在于学问权益统治编造,该编造确保品牌方对天生实质坚持无缺独揽权,同时维持多方数据的安定团结,处置了AI营销范围永久存正在的版权归属与数据隐私困难。比方,某时尚品牌可通过Firsthand平台天生具备天性化保举本领的虚拟导购员,该AI代办不单能剖判用户偏好,还能依照及时对话动态调理营销计谋。
AI基本方法供应商Turing达成1.11亿美元E轮融资,由Khazanah Nasional Berhad领投,Westbridge Capital、Sozo Ventures等机构跟投。
Turing创造于2018年,公司最初以长途工程师雇用与审核平台发迹,正在疫情时刻因长途团结需求激增而急速繁荣,2022年转型进入AI范围,现已成为天生式AI演练数据与开采器材的核压效劳商。
其主题生意包含通过连结环球超400万开采者的搜集,为OpenAI、Anthropic、Google等头部AI公司天生定造化演练数据集(如代码、人类反应深化研习数据),并供应LLM Lab、ALAN等器材加快AI使用开采。截至2025年3月,其ARR达1.67亿美元,并已完毕结余。
Ceramic达成1200万美元的种子轮融资,由NEA领投,IBM、Samsung Next、Earthshot Ventures和Alumni Ventures等投资者介入。
Ceramic为企业供应前辈的AI基本方法,旨正在优化狂言语模子的演练经过。该公司的平台维持长文本演练,答允模子一次措置多达96000个单词而不会显示功能降低,同时升高了推理功能。
Ceramic的处置计划使企业可以愚弄我方的数据和特定范围学问定造AI模子,加快AI模子的开采、演练和扩展。
Darwinbox得到由Partners Group和KKR配合领投,Gravity Holdings跟投的1.4亿美元战术融资。此前,该公司正在2022年的D轮融资中估值冲破10亿美元,成为独角兽企业。
Darwinbox是一家印度人力资源科技公司,埋头于供应搬动优先、AI驱动的一体化人力血本统治(HCM)平台。其产物掩盖雇用、考勤、薪酬、绩效统治等主题HR功效,并通过AI技艺优化流程,比方愚弄天生式AI提拔雇用效力和员工体验。
目前,该平台已效劳环球130个国度的1000多家企业,包含星巴克、妮维雅、AXA、Cigna等出名客户,统治横跨300万名员工。
Aescape近期达成8300万美元战术融资,由Valor Equity Partners领投,参投方包含Alumni Ventures及NBA球星Kevin Love等。此轮融资后,公司总融资金额达1.28亿美元。
Aescape愚弄前辈的人为智能技艺,供应全国上首个全主动、可定造的推拿体验,完毕天性化保健和病愈。
Aescape由四次创业的Eric Litman创立,公司正在昨年与纽约阔绰健身品牌 Equinox竣工团结,初次供应商用主动推拿体验。Aescape估计2025年将再出货400台设置, 还告示与栈房、企业矫健、阔绰房地产和职业体育范围的行业带领者设置团结伙伴联系,此中包含四时栈房及度假村、万豪栈房和丽思卡尔顿栈房。
AI驱动的视觉检测公司Zeitview告示达成6000万美元融资,由Climate Investment领投,现有投资者Valor Equity Partners、Union Square Ventures、Upfront Ventures等跟投。
Zeitview是埋头于AI驱动的症结基本方法检测与分解的科技公司,其主题技艺为视觉AI平台Insights,它通过无人机+AI主动化分解明显缩短检测周期(古板人为检测的1/3时代),同时下降对专业劳动力的依赖。其平台整合了及时危机预测模子,可评估资产退化趋向并提出优先级保卫创议。
与简单资产种此表检测计划分歧,Zeitview的差别化上风正在于跨行业平台本领,掩盖太阳能、风能、公用方法、房地产等多类基本方法,比正派在太阳能电站中精准定位面板缺陷,或正在风力发电场识别叶片机闭危机。
VIE Technologies近期达成1500万美元的A轮融资,由Energy Impact Partners领投。
VIE Technologies为能源公司、数据核心运营商和工业方法供应前辈的能源监测和预测性保卫处置计划。该公司通过其特此表非侵入式AI驱动预测保卫处置计划,利用前辈的物联网传感器和预测分解技艺,可以提前检测设置题目,保举缮治计划,从而升高电力编造的牢靠性。
VIE Technologies的产物和效劳合用于数据核心、公用工作和工业部分,帮帮客户升高运营效力、削减停机时代和拉长设置寿命。
VIE Technologies的创始人兼首席实行官Rahul Chaturvedi是一位具有25年无线行业体会的立异者,曾发通晓MiFi等紧急技艺。
本文由阿尔法公社归纳自多个讯息源,并正在AI大模子的辅帮下写作,封面图片由Hidream.ai的Pixeling(千象)天生。