数据科学简讯 2023-03-07


头条


Brave Search 推出 AI 支持的摘要功能

AI 驱动的功能正在搜索引擎中大量涌现。 Brave Search 推出了一项新的“Summarizer”功能,该功能由不同的大型语言模型 (LLM) 提供支持——OpenAI 的 GPT 技术不是其中之一。顾名思义,它的工作是提供使用不同来源的搜索查询的概要。摘要功能可供桌面和移动设备上的所有 Brave Search 用户使用——可通过任何浏览器访问。

2022 年 100 篇被引用次数最多的 AI 论文

谷歌仍然在 AI 研究中占据首位,加州大学伯克利分校在学术团体中享有这一荣誉。考虑到来自 Google 和 Deepmind 等团队的论文数量,令人印象深刻的是,规模小得多的团队发表的论文要少得多,但可能更有影响力。

200 年历史的数学打开了 AI 的神秘黑匣子

无论是设计微芯片还是构想新蛋白质,有时神经网络似乎无所不能。然而,臭名昭著的是,这些受大脑启发的人工智能系统以神秘的方式工作,引发了人们对它们所做的事情可能没有任何意义的担忧。一项新的研究发现,新的研究表明,已有 200 年历史的数学可以帮助阐明神经网络如何执行复杂的任务,例如预测气候或模拟湍流。研究人员说,这反过来可能有助于提高神经网络的准确性和它们的学习速度。


研究


通过 ELBO 最大化的镜头更好地理解扩散

就样本质量而言,扩散是目前最好的生成方法之一。这来自损失和去噪过程的良好特性。在社区中,每步噪声使用不同的加权方案,这导致不同的经验结果。事实证明,这些非均匀加权方案可以从似然最大化的角度来理解。这是朝着更深入地了解这一现代主力的理论迈出的重要一步。

文本生成与机器人控制

由于机器人缺乏物理世界的经验,因此将大型语言模型应用于机器人具有挑战性。为了克服这个问题,使用引导解码策略来构建一个既可能根据语言模型又可以在环境中实现的动作序列。该策略通过利用两种模型的知识来解决机器人环境中的复杂任务。他们将自己的工作与 SayCan 进行比较。

无限大小的扩散恢复

本文讨论了扩散模型在零镜头图像恢复中的应用,并提出了一种在保持零镜头优良特性的同时处理任意尺寸图像的方法。所提出的方法称为 Mask-Shift Restoration,解决局部不连贯,而 Hierarchical Restoration 减轻域外问题。这些简单、无参数的方法不仅可以用于图像恢复,还可以用于无限大小的图像生成。


工程


对加速多 GPU 训练感兴趣?梯度积累是你的瓶颈

如果你不小心,分布式 Pytorch 可能会非常慢。在多个 GPU 上运行模型时,您会以预定义的间隔取所有梯度更新的平均值。但是,如果您不小心,您的代码将在 GPU 之间同步每次向后传递。

早期辍学以减轻神经网络中的欠拟合

该研究表明,仅在训练的初始阶段应用的早期退出可以通过减少梯度的方向方差并将它们与整个数据集的梯度对齐来减轻欠拟合。所提出的方法不断提高各种视觉任务的泛化精度,并鼓励对深度学习中的正则化进行进一步研究。

上下文集群:视觉表示的新范例

这项工作引入了上下文聚类 (CoCs),这是一种新的视觉表示范例,它将图像视为一组无组织的点,并通过简化的聚类算法提取特征。 CoC 是无卷积和无注意力的,仅依靠聚类进行空间交互。尽管没有以最先进的性能为目标,但 CoC 在多个基准测试中取得了与 ConvNets 或 ViTs 相当甚至更好的结果。


杂七杂八


ChatGPT 是如何建立的内幕

为了了解 ChatGPT 背后的内幕——它是如何制作的,OpenAI 自发布以来如何对其进行更新,以及它的制造者如何看待它的成功——作者与四个帮助构建它的人进行了交谈。他们是 Sandhini Agarwal(在 OpenAI 从事政策工作)、Liam Fedus(从事 ChatGPT 工作的科学家)、John Schulman(OpenAI 的联合创始人)和 Jan Leike(OpenAI 对齐团队的负责人)

OpenAI 是否通过 ChatGPT API 赚钱

根据一些假设,尽管价格大幅下跌,但最新的 GPT-Turbo 模型似乎仍可大量获利。

为什么人工智能不会导致失业

在本文中,马克·安德森 (Marc Andreessen) 论证了与其他先前新技术类似的情况,人工智能不会导致大规模失业。

有一个人工智能.....

今天为各种应用程序构建的许多有用的 AI 工具的广泛列表。收集资源或灵感的好地方。

OpenAI-Python (GitHub Repo)

OpenAI-Python 提供从用 Python 编写的应用程序访问 OpenAI API。

OpenAI PHP (GitHub Repo)

OpenAI PHP 是一个 PHP API 客户端,允许您与 OpenAI AI API 进行交互。

Machine Learning Notes (GitHub Repo)

机器学习笔记是有用的机器学习代码和片段的集合。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容