数据科学简讯 2023-03-07

头条

Brave Search 推出 AI 支持的摘要功能

AI 驱动的功能正在搜索引擎中大量涌现。 Brave Search 推出了一项新的“Summarizer”功能，该功能由不同的大型语言模型 (LLM) 提供支持——OpenAI 的 GPT 技术不是其中之一。顾名思义，它的工作是提供使用不同来源的搜索查询的概要。摘要功能可供桌面和移动设备上的所有 Brave Search 用户使用——可通过任何浏览器访问。

2022 年 100 篇被引用次数最多的 AI 论文

谷歌仍然在 AI 研究中占据首位，加州大学伯克利分校在学术团体中享有这一荣誉。考虑到来自 Google 和 Deepmind 等团队的论文数量，令人印象深刻的是，规模小得多的团队发表的论文要少得多，但可能更有影响力。

200 年历史的数学打开了 AI 的神秘黑匣子

无论是设计微芯片还是构想新蛋白质，有时神经网络似乎无所不能。然而，臭名昭著的是，这些受大脑启发的人工智能系统以神秘的方式工作，引发了人们对它们所做的事情可能没有任何意义的担忧。一项新的研究发现，新的研究表明，已有 200 年历史的数学可以帮助阐明神经网络如何执行复杂的任务，例如预测气候或模拟湍流。研究人员说，这反过来可能有助于提高神经网络的准确性和它们的学习速度。

研究

通过 ELBO 最大化的镜头更好地理解扩散

就样本质量而言，扩散是目前最好的生成方法之一。这来自损失和去噪过程的良好特性。在社区中，每步噪声使用不同的加权方案，这导致不同的经验结果。事实证明，这些非均匀加权方案可以从似然最大化的角度来理解。这是朝着更深入地了解这一现代主力的理论迈出的重要一步。

文本生成与机器人控制

由于机器人缺乏物理世界的经验，因此将大型语言模型应用于机器人具有挑战性。为了克服这个问题，使用引导解码策略来构建一个既可能根据语言模型又可以在环境中实现的动作序列。该策略通过利用两种模型的知识来解决机器人环境中的复杂任务。他们将自己的工作与 SayCan 进行比较。

无限大小的扩散恢复

本文讨论了扩散模型在零镜头图像恢复中的应用，并提出了一种在保持零镜头优良特性的同时处理任意尺寸图像的方法。所提出的方法称为 Mask-Shift Restoration，解决局部不连贯，而 Hierarchical Restoration 减轻域外问题。这些简单、无参数的方法不仅可以用于图像恢复，还可以用于无限大小的图像生成。

工程

对加速多 GPU 训练感兴趣？梯度积累是你的瓶颈

如果你不小心，分布式 Pytorch 可能会非常慢。在多个 GPU 上运行模型时，您会以预定义的间隔取所有梯度更新的平均值。但是，如果您不小心，您的代码将在 GPU 之间同步每次向后传递。

早期辍学以减轻神经网络中的欠拟合

该研究表明，仅在训练的初始阶段应用的早期退出可以通过减少梯度的方向方差并将它们与整个数据集的梯度对齐来减轻欠拟合。所提出的方法不断提高各种视觉任务的泛化精度，并鼓励对深度学习中的正则化进行进一步研究。

上下文集群：视觉表示的新范例

这项工作引入了上下文聚类 (CoCs)，这是一种新的视觉表示范例，它将图像视为一组无组织的点，并通过简化的聚类算法提取特征。 CoC 是无卷积和无注意力的，仅依靠聚类进行空间交互。尽管没有以最先进的性能为目标，但 CoC 在多个基准测试中取得了与 ConvNets 或 ViTs 相当甚至更好的结果。

数据科学简讯 2023-03-07

数据科学简讯 2023-03-07

头条

Brave Search 推出 AI 支持的摘要功能

2022 年 100 篇被引用次数最多的 AI 论文

200 年历史的数学打开了 AI 的神秘黑匣子

研究

通过 ELBO 最大化的镜头更好地理解扩散

文本生成与机器人控制

无限大小的扩散恢复

工程

对加速多 GPU 训练感兴趣？梯度积累是你的瓶颈

早期辍学以减轻神经网络中的欠拟合

上下文集群：视觉表示的新范例

杂七杂八

ChatGPT 是如何建立的内幕

OpenAI 是否通过 ChatGPT API 赚钱

为什么人工智能不会导致失业

有一个人工智能.....

OpenAI-Python (GitHub Repo)

OpenAI PHP (GitHub Repo)

Machine Learning Notes (GitHub Repo)

推荐阅读更多精彩内容