头条
Mistral 寻求估值为 5B 美元的融资
有报道称,开源先驱 Mistral 正在寻求数亿美元的资金来训练更多模型。
Stability AI 发布 Stable Diffusion API
Stability AI 已通过 API 及其名为 Stable Assistant Beta 的新内容创建平台向一些开发人员提供了最新的文本到图像 AI 模型 Stable Diffusion 3。 该模型仍处于预览阶段,尚未向公众开放。
欧洲汽车制造商将试用 Sanctuary AI 的人形机器人
继麦格纳于 2021 年投资 Sanctuary AI 后,Sanctuary AI 将向麦格纳汽车制造工厂交付其人形机器人 Phoenix。 Phoenix 以其行走能力和灵巧的双手而闻名,旨在提高制造效率。 试点的具体细节,包括机器人的数量和部署细节,尚未披露。
研究
Mistral 8x22B 报告和说明模型
新的米斯特拉尔基地报告今天发布。 此外,他们自己的指令调整模型是在类似的许可许可下发布的。 他们报告了强大的 MMLU 和 HumanEval 性能,以及令人难以置信的多语言英语、法语、意大利语、德语和西班牙语性能、函数调用和 64k 本地上下文长度。
如何与 Olmo 一起提高 MMLU 24 分
最新完全开放的7B语言模型升级,MMLU推理成绩大幅提升。 其开发团队发现改变数据混合对性能有很大影响。 他们提供了新数据源的准确统计数据以及导致这一改进的百分比。
稳定的音频纸
本文介绍了 Stability AI 用于音频合成的扩散Transformer模型。
工程
将 ML 模型投入生产的挑战
行业专家的深入访谈,探讨将 AI 模型投入生产的挑战和解决方案,以及 MLOps 与传统工程的不同之处。 他们讨论了为什么很少有 ML 项目投入生产,以及作为一个组织如何集中精力实际启动。
Effort
Effort 库允许实时调整 LLM 模型推理期间执行的计算数量,从而在保持大部分质量的同时显着提高速度。 尽管存在一些实现开销,但初步结果表明,Effort 库有可能在保持质量的同时显着提高 LLM 推理速度。 作者鼓励其他人测试 0.0.1B 版本并提供反馈以进一步改进该库。
使用扩散模型的图像字幕 (GitHub Repo)
这项研究重新审视了使用扩散模型进行图像到文本的生成。 它引入了 LaDiC 架构,该架构增强了扩散模型在图像字幕任务中的性能。
杂七杂八
用自然语言驾驶
Wayve 的 Lingo-2 是用于自动驾驶任务模拟的 VLM 列车。 它根据视频输入执行驾驶动作。 Lingo-2 包含对基于场景的驾驶动作的推理描述。
你所需要的就是注意力吗?
研究人员正在开发替代架构,以解决 Transformer 在长上下文学习、生成和推理速度方面的局限性,在较小规模但可扩展性不确定的情况下显示出有竞争力的质量。 该子领域的快速进展表明帕累托边界将继续扩大,从而实现更长的上下文建模和更大的推理吞吐量,最终增加人工智能的用例数量。
人工智能的动态变化和元护城河
建立一家成功的人工智能公司需要驾驭复杂的短期、中期和长期动态,保持精英的速度和执行力,拥有更多的堆栈,收集独特的数据,并利用合成数据生成。 随着人工智能行业的成熟,公司必须适应不断变化的人才动态,了解他们正在建造的机器以及他们所依据的竞争轴心,以创造持久的护城河并在喧嚣中脱颖而出。
验证权重 DDP Pytorch (GitHub Gist)
跨设备分片时验证训练可能具有挑战性 - 这个方便的代码片段验证事情是否已正确完成和更新。
Luminal (GitHub Repo)
Luminal 是一个深度学习库,它使用可组合编译器来实现高性能。
谷歌地图将使用AI 来帮助人们找到充电桩
谷歌地图将使用人工智能来总结电动汽车充电器的方向,并提供可靠性和等待时间。