HiDream.ai发布“智象视觉多模态生成式大模型”，微软、谷歌将大模型全面整合

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者（AlphaFounders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本图由Pixeling（千象）生成

本周，我们观察到以下AI领域的新动向和新趋势：

1.阿尔法公社种子轮投资的HiDream.ai正式发布了「智象视觉多模态生成式大模型」，它旗下的通用创作工具——Pixeling（千象）提供文字生成图片、文字生成视频、视频编辑等功能，并且支持中文提示词。

2.微软和谷歌将大模型能力全面整合到自己的产品，其中微软将把其Copilot嵌入到即将迎来大更新的Windows11中，并为Office套件带来全新功能，谷歌Bard则推出插件系统，正式与谷歌全家桶应用全面整合。

3.AI安全创业公司HiddenLayer获5000万美元A轮融资，是今年AI安全领域金额最大的A轮融资，它的MLSec平台为AI提供全面的安全性，旨在保护AI和机器学习模型免受各种攻击。

1.HiDream.ai 「智象视觉多模态生成式大模型」重磅发布，Pixeling可使用中文提示词

2023年9月20日，通用人工智能创新发展大会在合肥召开，HiDream.ai 智象未来创始人兼CEO梅涛院士在会上正式发布了「智象视觉多模态生成式大模型」，并展示了HiDream.ai目前的基础模型能力及应用进展。

「智象视觉多模态生成式大模型」拥有超过60亿参数，能实现文本、图片、视频等多模态内容生成，并通过交互式生成技术实现精准可控的内容生成；同时依托多模态基础模型强大的底座能力，可快速适配客户专有领域应用。自8月开放内测以来，该模型已经经历了多次迭代更新，旨在为用户提供更优化的创作体验。

基于这一大模型，HiDream.ai推出了面向所有设计师的通用创作工具——Pixeling（千象），支持创意生成、艺术创作、在线编辑等全过程的可视化。Pixeling目前已经支持文字生成图片、文字生成视频、视频编辑等功能，并计划未来推出更多的创作功能。目前，Pixeling不仅可用英文Prompt，还支持中文的提示词。

2.Windows 11深夜大更新，大模型Copilot全覆盖Office

近日，微软宣布新版Windows 11将于9月26日上线，而微软Copilot将作为Windows 11免费更新的一部分直接嵌入每一位用户的操作系统。

这次的Windows 11更新带来了超过150项新功能，其中包括为PC用户带来的Copilot强大功能，以及画图、照片等应用的全新AI体验。必应搜索也将增加对OpenAI最新DALL?E 3模型的支持，提供更加个性化的答案和全新的AI购物体验。而Microsoft 365 Copilot预计将于今年11月1日面向企业客户全面推出，这将是一款能彻底改变用户工作方式的全新AI助手。

Copilot在Office套件中的应用也是此次更新的重点。在Word、Excel、OneNote、Outlook等应用中，都将带来新功能和新能力。

3.Bard与谷歌全家桶全面整合，大模型史上首次上网自查，邮件地图文档视频一网打尽

谷歌的Bard推出插件系统，正式与谷歌全家桶应用全面整合。Bard现可从Gmail、Docs、谷歌地图、YouTube等应用中提取并总结信息，并具备了前所未有的自查功能。

这意味着用户可以更方便地从谷歌的各种应用中获取所需信息，如制定旅行计划、撰写简历、制定商业合作计划等。

此外，Bard还引入了“Google It”按钮，允许模型自我检查其回答的准确性。这一功能使Bard成为了首个能主动承认错误的模型。但这一功能仍有待完善，某些回答可能仍存在误差。

4.AI重新定义PC，英特尔CPU迎40年来最重大的架构转变

在Innovation 2023大会中，英特尔CEO基辛格（Pat Gelsinger）展示了英特尔在AI领域的新动向，他主持发布了代号Meteor Lake的酷睿Ultra处理器，新处理器带来了英特尔40年来最重大的处理器架构转变。

这款处理器首次将独立的NPU AI引擎融入其中，采用分离式模块和先进的FOVEROS 3D封装技术。此外，英特尔还预览了第五代至强处理器，预计将使机架密度提升2.5倍。在AI计算方面，英特尔展示了三代AI芯片路线图，其中5nm制程的Gaudi 3将于明年推出。

5.OpenAI祭出绘画神器，DALL·E 3联手ChatGPT，无需prompt一笔成神

OpenAI官宣了DALL·E 3，是它发布的最强文生图模型，而且它将DALL·E 3与ChatGPT进行了合并，为AI绘画圈带来了革命性的变革。

prompt 为「这幅插画描绘了一颗由半透明玻璃制成的人心，矗立在惊涛骇浪中的基座上。一缕阳光穿透云层，照亮了心脏，揭示了其中的小宇宙。地平线上镌刻着一行醒目的大字『Find the universe within you』」

全新的DALL·E 3能够更加精准地理解语义，细节逼真，甚至能够准确呈现图像中的文本。同时，用户无需再为prompt而烦恼，只需与ChatGPT对话，即可生成精美的图像和文本。

目前，DALL·E 3仍在内测阶段，预计将在10月上旬正式推出。与此同时，DALL·E 3的发布也使得其与Midjourney的对比成为了热门话题，从多方面的对比来看，DALL·E 3在细节和准确性上都有了显著的提升。

6.ChatGPT启发，谷歌DeepMind预测7100万基因突变！AI破译人类基因遗传密码登Science

DeepMind继AlphaFold之后，再次推出了震撼生物医药领域的强大AI模型AlphaMissense，成功预测了7100万「错义突变」，其中89%的预测中，57%是致病性，32%是良性。

错义突变是一种基因突变，能够影响人类蛋白质的功能，与多种疾病如囊性纤维化、镰状细胞贫血和癌症等有关。AlphaMissense的推出展示了AI在医学、特别是遗传学领域的巨大潜力，对于理解遗传变异与疾病的关系，以及开发针对性的药物治疗都具有深远意义。

此模型的构建灵感来源于ChatGPT，通过预测多重序列比对中的氨基酸身份，进行蛋白质语言建模。AlphaMissense的预测结果与英格兰基因组学组织的研究一致，为其在真实世界中的应用提供了基准。

7.Transformer+强化学习，谷歌DeepMind让大模型成为机器人感知世界的大脑

谷歌DeepMind近日提出了Q-Transformer，旨在将大规模机器人学习与基于Transformer的现代策略架构结合。

在机器人学习方法中，整合大型多样化数据集并使用强大的模型如Transformer，可以开发出具备泛化能力的策略，使机器人处理各种任务。但大部分机器人学习模型此前都是通过监督学习方法训练的，其性能受限于人类提供的高质量演示数据。

Q-Transformer的目标是结合大规模真实世界数据集的机器人学习与Transformer。这种方法在真实世界任务上的表现优于其他基准方法。Q-Transformer的主要贡献是为机器人离线强化学习提供了基于Transformer的架构，能用于大规模多样化机器人数据集，包括真实世界数据。

DeepMind的实验结果显示，Q-Transformer在真实世界任务上的表现显著优于其他方法，并能有效地利用自动事件片段来提高技能。

8.大模型竟塞进自动驾驶，AI会解说自己怎么开车了！

英国的自动驾驶创业公司Wayve由出身剑桥大学的AI专家Alex Kendall创立，近日它们推出的LINGO-1为自动驾驶赋予了“语言”。

它们推出了LINGO-1，将大语言模型与自动驾驶技术深度融合，使车辆能够对其行为进行解释，例如解释为何在红灯前停车或为何准备左转。这一技术的核心在于一个专门的数据集，其中包含了专业驾驶员的驾驶解说，结合图像、语言和行动数据。

这种结合使得自动驾驶系统不再是一个“黑盒”，而是可以与人类进行交互和解释其决策的系统。LINGO-1的推出，不仅提高了自动驾驶的可解释性，还为其带来了更高的安全性和效率。未来，这种结合自然语言的自动驾驶技术有望为行业带来革命性的变革。

9.34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%

滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究团队联合开源了专为「通用数学问题」设计的大模型MAmmoTH及其指令调优数据集MathInstruct。

MAmmoTH系列在9个数学推理数据集上的表现显著优于现有开源模型，平均准确率提高了12%至29%。特别是，MAmmoTH-34B模型在MATH数据集上的准确率达到了46%，超越了GPT-4的结果。

数学推理问题长期是语言模型的难题，而MAmmoTH的成功为此提供了新的解决方案。该模型结合了思维链（CoT）和思维程序（PoT）的方法，能够处理从基础到高级的各种数学问题。此外，研究人员还开发了MathInstruct数据集，涵盖了广泛的核心数学领域，如算术、代数、概率、微积分和几何等。

10.上交AI数学开源模型阿贝尔，在多个权威评测集上取得开源第一

近期，上海交大生成式人工智能研究组(GAIR)研发并开源了数学计算大模型“阿贝尔（Abel）”，在多个权威评测集上取得了开源第一的成绩，成为首个由海内外高校团队推出的SOTA数学开源大模型。

阿贝尔模型在GSM8K和MATH评测集上的表现超越了多个国外大厂的模型，如PaLM-1、Minerva、Claude-instant和ChatGPT。为了训练阿贝尔，研究团队提出了Parental Oversight（家长监督）策略，强调在微调大模型时应持敬畏和谨慎态度。尽管阿贝尔在评估数据集上表现优异，但也存在过拟合、泛化性、通用性等局限。研究团队已列出这些问题，并在Github上维护限制和潜在解决方案。

11.LLM变现平台来了！LangChain+DemoGPT合作：有了idea就能挣钱

LangChain与DemoGPT宣布深度合作，推动大型语言模型（LLM）的应用开发与变现。借助DemoGPT，开发者可以利用LangChain通过自然语言构建应用程序，并在DemoGPT Marketplace展示、交换，与用户互动，获取反馈并实现应用变现。

DemoGPT简化了基于LLM的应用开发流程，能够自动生成LangChain x Streamlit应用程序。其核心功能包括规划、任务创建、代码段生成、代码段合并等，每个阶段都经过自我优化以提高效率。此外，DemoGPT Marketplace为开发者提供了一个平台，允许他们展示、交换并变现自动生成的应用程序。这一合作意味着，只需一个好的创意，即使不编写代码，也可以实现应用开发与变现。

1.HiddenLayer获5000万美元A轮融资，加速AI安全领域的发展

官方网站：hiddenlayer.com

HiddenLayer是一家专注于人工智能模型和资产安全的创业公司。它近日获得由微软风险基金M12和Moore Strategic Ventures领投的5000万美元A轮融资，这是今年AI安全领域金额最大的A轮融资。

HiddenLayer的MLSec平台为AI提供全面的安全性，旨在保护AI和机器学习模型免受各种攻击和漏洞。其核心产品MLDR提供了一种监控AI算法输入和输出的方法，为资产提供实时防御。

HiddenLayer首席执行官Chris Sestito表示，他们的目标是为每个组织提供工具和专业知识，以安全地利用AI。他强调，尽管AI的应用已经非常广泛，但没有其他技术在没有安全措施的情况下获得如此广泛的采纳。

自2022年7月起，HiddenLayer已经展现出强劲的增长和市场领导地位，与Intel和Databricks建立合作伙伴关系，并获得了多个行业奖项。公司员工数量在过去的一年中增长了近四倍，并计划在年底之前再增加40名专家。目前，该公司已为多个领域的财富100强公司的AI模型提供保护。

2.AI云安全公司Tamnoon获Merlin Ventures领投的510万美元种子轮融资

官方网站：www.tamnoon.io

AI云安全公司Tamnoon获得Merlin Ventures和Secret Chord Ventures领投的510万美元种子轮融资，Elron Ventures，Inner Loop Capital跟投。

尽管技术已经较为先进，但云安全仍然具有挑战性。如何在错误配置变成事件之前修复和防止错误配置，逐渐成为一个越来越重要的领域。

Tamnoon结合了人类专业知识和人工智能，旨在帮助团队快速、安全地修复云风险，同时限制配置更改可能对其环境造成的负面影响。

在采取任何修复措施前，Tamnoon的CloudPros会识别被警告资产的重要性、功能和敏感性，同时从技术和业务角度评估资产的可利用性或对组织的潜在威胁，设定处理优先级。此外，Tamnoon整合了与单个资产相关的重复警报，以消除核心问题中不必要的干扰。

Tamnoon由Zohar Alon、Idan Perez和Marina Segal联合创立，他们都曾在以色列安全公司Check Point Software工作多年，并在云安全领域有深厚积累。

3.将大语言模型的GPU计算量减少约50%，Enfabrica获英伟达参投的1.25亿美元B轮融资

官方网站：enfabrica.net

AI网络硬件公司Enfabrica获得由Atreides Management领投的1.25亿美元B轮融资，NVIDIA，IAG Capital Partners、Alumni Ventures等机构跟投。本轮融资后，Enfabrica融资总额达到1.48亿美元。

目前生成式AI面对的一大挑战是AI基础设施的扩展，无论是在计算的成本还是计算的可持续性方面，而传统网络芯片很难满足现代人工智能工作负载的数据迁移的需求。

Enfabrica的硬件（加速计算结构交换机，简称 ACF-S）除了在内存和网络设备之外，还可以在GPU、CPU和AI加速器芯片之间提供高达“每秒多太比特（multi-terabit-per-second）”的数据迁移。

Enfabrica声称，采用“基于标准”的接口，硬件可以扩展到数万个节点，并在相同的性能点上将大语言模型的GPU计算量减少约50%。ACF-S设备通过在数据中心服务器机架内提供高效、高性能的网络、I/O和内存，从而通过减少GPU、CPU和其他AI加速器的使用量来使运行经过训练的AI模型的公司受益。

Enfabrica由Shrijeet Mukherjee与Rochan Sankar(CEO)于2019年共同创立。前者是谷歌网络平台和架构负责人；后者毕业于多伦多大学，并在沃顿商学院攻读了MBA，曾是博通的工程总监。团队还包括几位来自思科、Meta和 Intel等公司的创始工程师。

4.无人驾驶汽车公司Conigital获得5亿英镑A+轮融资

官方网站：conigital.org

英国的无人驾驶汽车公司Conigital获得5亿英镑A+轮融资，这笔资金来自于与一家管理1500亿英镑资产的全球私募。

Conigital致力于开发名为ConICAV?的无人驾驶平台，该平台可为各种车辆提供改装和定制建造服务，尤其是为工业和商业车队。其独特的远程监控和操作平台采用了可解释的AI和模拟优先的方法，确保了系统的可扩展性和快速的迭代更新。

Conigital的技术已在机场、港口、物流场地、工业区和智能园区等特定环境中得到早期商业应用。目前，该公司在澳大利亚、巴西和印度均有业务布局。

Conigital首席执行官Don Dhaliwal表示，这次融资的资金将用于吸引顶尖人才，扩展合作伙伴网络，并实施并购策略，以在国内外进一步扩张。

5.重塑医疗AI，DeLoreanAI获755万美元A轮融资

官方网站：deloreanai.com

DeLoreanAI近日完成由Sopris Venture Capital领投的755万美元的A轮融资，Pinta Capital Partners和Oak Street Health的前高管James Chow参投，这使得公司总融资额达到约1100万美元。

DeLoreanAI的核心产品是其医疗AI系统，该系统为医务人员和保险公司提供有关患者健康状况的关键洞察。与传统AI工具不同，DeLoreanAI不仅提供预测，还能实时生成下一步的最佳行动建议，帮助医务人员更好地制定治疗方案。

DeLoreanAI首席执行官MacLaughlin表示，他们的AI预测已经得到了三个独立组织的验证，确保其准确性。

其中，United Healthcare已将DeLorean的算法应用于其数千万患者的记录上，每天处理超过4000万患者的数据。DeLorean的系统旨在为高风险患者提供预防性治疗，预计每位患者可以节省数万美元的医疗费用。例如，对于糖尿病患者，每年可以节省2800美元，而对于接受透析的患者，每年节省金额可达15000美元。

6.Scala Biodesign获得由TLV Partners领投的550万美元种子轮融资

官方网站：www.scala-bio.com

Scala Biodesign获得以色列早期投资机构TLV Partners领投的550万美元种子轮融资。Scala的创始人表示他们可以加速工程治疗分子的最慢的方面。

Scala Biodesign由联合创始人兼首席执行官Ravit Netzer博士和首席技术官Adi Goldenzweig博士创立。Netzer博士和Goldenzweig博士研究并开发了重新设计天然蛋白质的算法，称为PROSS，该算法产生的变体可改善半衰期和热稳定性。目前，PROSS被用于各种商业应用，Scala Biodesign正与几家制药公司合作开展蛋白质工程项目。

Scala Biodesign的算法利用人工智能、基于物理的建模和天然蛋白质的数据来设计和改进蛋白质，以开发新药物、疫苗和抗体，并为食品科技和工业酶制剂创造蛋白质，可帮助企业以更快的速度、更低的成本开发出新的药品和食品，甚至可以创造出传统方法无法实现的全新生物技术应用。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作，封面图片由Hidream.ai的Pixeling（千象）生成。

关于阿尔法公社

返回搜狐，查看更多

责任编辑：