头条
OpenAI 创建灾难预案团队
https://openai.com/blog/frontier-risk-and-preparedness
OpenAI组建了一个新团队来应对网络安全、核灾难等AGI前沿风险。
拜登政府准备宣布一项关于AI行政命令
https://www.engadget.com/the-white-house-will-reportedly-reveal-a-sweeping-ai-executive-order-on-october-30-200558649.html
拜登政府正准备宣布一项关于人工智能的全面行政命令,旨在为联邦机构采用人工智能制定标准,并解决与人工智能进步相关的担忧。
联想与 NVIDIA 扩大混合人工智能解决方案合作伙伴关系
https://nvidianews.nvidia.com/news/lenovo-nvidia-hybrid-ai
联想和 NVIDIA 正在扩大合作伙伴关系,以提供利用从边缘到云端的生成式 AI 的集成系统。 他们旨在帮助企业快速部署定制的人工智能应用程序以实现业务创新。 他们的解决方案由 Lenovo AI Professional Services Practice 提供支持,将使用混合云方法和 NVIDIA 最新的生成式 AI 硬件。
研究
在开放数据上训练的图像扩散模型
https://arxiv.org/abs/2310.16825
最流行的扩散模型(例如稳定扩散)已经在各种数据上进行了训练,但其中大部分数据受到不同的版权限制。 MosaicML 的这个新模型纯粹基于 Creative Commons 数据进行训练,并且只需要一小部分训练数据即可实现与 SD 2 类似的性能。
LLM 中的 4 位量化
https://arxiv.org/abs/2310.16836v1
本研究引入了 LLM-FP4,这是一种通过在训练后将权重和动作转换为 4 位浮点值来压缩大型语言模型的新颖方法。
评估GPT-4V的光学字符识别能力
https://arxiv.org/abs/2310.16809v1
本文探讨了大型多模态模型 GPT-4V 在各种光学字符识别 (OCR) 任务(从阅读场景和手写文本到理解复杂文档结构)中的表现。
工程
水下航行器实时深度估计 (GitHub Repo)
https://github.com/ebnerluca/uw_depth
这项研究提出了一种为水下航行器量身定制的模型,可以通过结合稀疏的深度细节来估计单个图像的实时深度。
GPT 试点(GitHub 存储库)
https://github.com/Pythagora-io/gpt-pilot
GPT Pilot 是一款人工智能驱动的开发工具,可以从头开始编写可扩展的应用程序。 它使开发人员能够使用他们想要构建的应用程序类型的描述来创建应用程序。 GPT Pilot 逐步创建应用程序,同时在遇到困难时提出问题以进行澄清或帮助。 存储库中提供了视频演示。
ToRA(GitHub 存储库)
https://github.com/microsoft/ToRA
ToRA 是一系列工具集成推理代理,旨在通过与工具交互来解决具有挑战性的数学推理问题。
杂七杂八
人工智能时代数据与软件工程的融合
https://tomtunguz.com/data-engineering/
人工智能需要数据才能发挥作用,这意味着数据功能越来越接近产品构建流程的核心,并逐渐远离内部商业智能。
图像中像素匹配的多功能方法 (GitHub Repo)
https://github.com/aim-uofa/rgm
该研究引入了 RGM(鲁棒通才匹配),这是一种专为图像中的稀疏和密集像素匹配而设计的深度学习模型。 该方法利用独特的级联 GRU 模块和新的大规模数据集。
Reddit 威胁要屏蔽 Google
https://www.theverge.com/2023/10/20/23925504/reddit-deny-force-log-in-see-posts-ai-companies-deals
如果 Reddit 无法与生成型人工智能公司达成交易以支付其数据费用,它可能会阻止搜索爬虫。 超过 535 家新闻机构选择阻止其内容被人工智能公司抓取。 X 的新读取限制是由于人工智能初创公司抓取数据造成的。
Google 扩大其 Bug 赏金计划以针对生成式 AI 攻击
https://www.engadget.com/google-expands-its-bug-bounty-program-to-target-generative-ai-attacks-120049796.html
谷歌扩大了其漏洞奖励计划(VRP),以涵盖人工智能特定的安全问题。
HuggingFace 数据集上的分布式地图 (Github Gist)
https://gist.github.com/jxmorris12/69a730fee174f5309968e984c298f8f2
映射数据集是将变换应用于每个数据点的标准方法。 跨多个 GPU 执行此操作很困难。 这个要点提供了很好的函数来做到这一点。