头条
三星将于今年推出升级版语音助手 Bixby,并搭载自家的 AI
https://www.cnbc.com/2024/07/11/samsung-to-launch-upgraded-bixby-this-year-with-its-own-ai.html
三星将于今年晚些时候推出基于自家 AI 模型的语音助手 Bixby 升级版,作为增强其设备 AI 功能更广泛举措的一部分。
谷歌称 Gemini AI 正在让其机器人变得更智能
https://www.theverge.com/2024/7/11/24196402/google-deepmind-gemini-1-5-pro-robot-navigation
谷歌的 Gemini 1.5 Pro AI 可以训练机器人使用视频导览和自然语言指令进行导航和完成任务,成功率达到 90%,并展示了先进的规划能力。
骁龙与英特尔、AMD 和Apple芯片比较
https://www.theverge.com/24191671/copilot-plus-pcs-laptops-qualcomm-intel-amd-apple
高通的骁龙 X Elite 和 X Plus 芯片正在将 Windows on Arm 变成一个可行的平台,在性能和电池寿命方面与苹果的 M3 芯片、英特尔酷睿 Ultra 和 AMD Ryzen 处理器展开激烈竞争。尽管在 GPU 性能方面并不领先,但骁龙芯片在多核基准测试和能效方面表现出色。新一波配备骁龙的笔记本电脑是 MacBook 和传统英特尔或 AMD 系统的经济实惠的替代品。
研究
PaliGemma 技术报告
https://arxiv.org/abs/2407.07726
PaliGemma 是基于 SigLIP 和 Gemma 2B 构建的强大视觉语言模型。本技术报告展示了在架构选择和数据收集方面做出的许多决策。
FlashAttention 3
https://tridao.me/blog/2024/flash3/
FlashAttention 是现代快速语言模型的基础。此新版本使用了 75% 的 H100 容量(高于之前的 35%)。有许多重要的系统改进导致了这种能力的提升。
使用 OV-DINO 进行开放词汇检测
https://arxiv.org/abs/2407.07844v1
OV-DINO 是一种新的开放词汇检测方法,它解决了集成不同数据源和利用语言感知功能的挑战。
工程
从单个图像中学习多个概念
https://haoosz.github.io/ConceptExpress/
无监督概念提取 (UCE) 是一项新任务,它从单个图像中提取并重新创建多个概念,而无需任何人工注释。
开放词汇视频实例分割
https://github.com/fanghaook/ovformer
OVFormer 是一种用于开放词汇视频实例分割 (VIS) 的新方法,可解决该领域的关键问题。它改进了嵌入对齐并利用基于视频的训练来增强时间一致性。
LLM 幻觉的简单解决方案
https://github.com/voidism/lookback-lens
Lookback Lens 是一种用于检测大型语言模型中的上下文幻觉的简单模型。
杂七杂八
卫星图像中的变化检测
https://imagine.enpc.fr/~elliot.vincent/sitsscd
本研究通过整合变化检测和语义分割,解决了使用卫星图像时间序列 (SITS-SCD) 进行语义变化检测的问题。
手写数学表达式识别
https://arxiv.org/abs/2407.07764v1
PosFormer 模型通过解决基于序列的模型的局限性,显著提高了手写数学表达式识别 (HMER)。
增强智能
https://www.polymathicbeing.com/p/augmenting-intelligence
本文讨论了弥合技术乐观主义者和人工智能悲观主义者之间的差距,并提倡以务实的方式使用人工智能来增强人类智能。它涵盖了人工智能对创造力和艺术的影响、人工智能的道德使用以及人工智能在教育中的作用。文章建议用“增强智能”一词作为更准确的描述,强调人工智能不是威胁,而是增强人类能力的工具。
上海发布首部人形机器人指南
https://finance.yahoo.com/news/chinas-laws-robotics-shanghai-publishes-093000734.html
在世界人工智能大会上公布的规则强调了人类安全和机器人的道德使用。
众包去中心化人工智能市场地图
https://threadreaderapp.com/thread/1810703553901563923.html
社区主导和互动的去中心化人工智能市场地图。
AiEditor
https://www.producthunt.com/posts/aieditor
一个开源的人工智能驱动的富文本编辑器。