头条
AI21 发布 Jamba 语言模型
曼巴是一种模型风格,应该在效率上击败Transformer,同时匹配性能。 Jamba 是一种包含 MoE 层的新颖变体。 它可以每秒 1.6k 个令牌运行,上下文长度为 128k 个令牌。 它在 MMLU 基准测试中达到了 67%。 重量是可用的。
Hume 推出移情语音界面
Hume 发布了移情语音界面(EVI),这是第一个具有情商的对话式人工智能。
谷歌开始在谷歌主搜索界面中测试 SGE 的AI
谷歌正在向部分美国用户试行人工智能在搜索结果中生成复杂查询的概述,而无需选择加入其搜索生成体验。 这种反馈驱动的测试旨在增强用户体验,并可能由于广告展示位置和自然搜索可见性的变化而影响网站流量动态。
研究
1 Bit, Post Training, Quantization
1 Bit language 模型令人兴奋。 这项工作展示了如何在不牺牲性能的情况下量化语言模型的线性层。 这可能会导致在消费级 GPU 上运行 70B 模型。
大型语言模型中的长形式事实性
人们可以使用语言模型来生成事实信息。 谷歌发布了一个数据集和基准测试来显示每个模型的表现如何。 该报告深入探讨了如何提高模型的真实性,并展示了语言模型在大多数情况下战胜了人类注释者。
改进模型适应性
CoDA 是一种新的无监督域适应 (UDA) 方法。 它通过学习场景和图像级别的差异,帮助人工智能模型更好地适应未标记的、具有挑战性的环境。
工程
使用 AI 识别内容中的混乱来源 (GitHub Repo)
这种方法可以精确定位触发用户在线问题的确切内容,从讲座到新闻文章。 这种方法称为回溯,旨在通过识别和理解困惑、好奇或情绪反应的原因来帮助内容创建者改进他们的工作。
高分辨率大型语言视觉助手 (GitHub Repo)
研究人员开发了一种新方法,即分辨率混合适应(MRA),可以提高人工智能识别图像细节的能力。
3D 医学成像数据集 (GitHub Repo)
CT-RATE 是一个将 3D 医学成像与文本报告结合在一起的数据集。 CT-CLIP 是针对这些图像进行优化的多功能人工智能框架。
杂七杂八
指数增长和人工智能逃逸速度
人工智能未来学家雷·库兹韦尔(Ray Kurzweil)发明了加速回报定律,该定律指出,随着时间的推移,进步的速度呈指数级增长。 在最近的一次讨论中,库兹韦尔探讨了各种主题,包括只会变得更好的前景、人工智能经济的发展方向、人类与人工智能的关系、长寿逃逸速度等等。
人工智能时代大量高薪工作
人工智能专家正在探索自动化人类任务,这引发了人们对失业和工资下降的担忧。 然而,认为人工智能进步将不可避免地导致人类工作被淘汰的观点可能并不正确。 由于计算能力和机会成本等限制,人类可能会在人工智能主导的未来保留就业,尽管这种情况并不能得到保证。
Meta 正在为其 Ray-Ban 智能眼镜添加人工智能功能
Meta 正在为其雷朋智能眼镜引入人工智能功能,包括翻译以及通过语音命令激活的物体、动物和纪念碑的识别。
谷歌将 Gemini Nano 引入 Pixel 8
Pixel 8 将在开发者预览版中配备 Gemini Nano,以增强录音机中的汇总和 Gboard 智能回复等功能。