数据科学简讯 2023-04-14


头条


埃隆·马斯克 (Elon Musk) 正在Twitter上推进一个AIGC项目

尽管最近支持暂停人工智能培训,埃隆·马斯克似乎正在 Twitter 上酝酿一个人工智能项目。他购买了大约 10,000 个 GPU,并且一直在聘请 AI 专家,同时探索与 ChatGPT 竞争的可能性。 Twitter 的这种生成式 AI 的确切用途尚不清楚,但它有可能用于增强搜索功能或广告。

免费的 Dolly,商业上可行的指令调整模型

在发布 Dolly 1.0 两周后,Databricks 发布了他们模型的下一个版本: Dolly 2 。该模型是基于 EleutherAI Pythia 模型的开放式指令调优模型。它已经在一个新的商业上可行的数据集上进行了指令调整。目前尚不清楚它与基于 llama 的模型或 GPT 3.5 turbo 相比如何,但比以前更开放的工作总是会令人感兴趣。


研究


Agents for science

语言模型充当工具(可能是其他语言模型)规划器的想法在社区中越来越受欢迎。本质就是让一个中央的、强大的语言模型(例如 GPT-4)可以访问一组工具。这些工具可以是网络搜索、文档、python 引擎。在这些额外功能的支持下,LLM 模型能够合成化学物质、推理反应,甚至拒绝合成海洛因—。

资源高效型 CLIP

RECLIP 为 CLIP 预训练引入了一种资源高效的方法,该方法利用小图像进行大规模语言监督并使用高分辨率数据进行微调。该方法实现了具有竞争力的零样本分类和图像文本检索精度,同时使用比基线少 6-8 倍的计算资源和 7-9 倍的 FLOP,使其更容易为更广泛的研究社区所用。

Multilingual ChatGPT

本研究评估了 ChatGPT 在 7 项任务和 37 种语言中的有效性,以更好地了解其多语言功能。尽管在英语方面取得了成功,但 ChatGPT 在各种 NLP 任务和语言方面的表现都比以前的模型差,这突出表明需要进一步研究开发更有效的多语言学习模型。


工程


Deepspeed Chat (GitHub Repo)

Deepspeed 是最好的分布式训练开源框架之一。他们整合了研究论文中的许多最佳方法。他们发布了一个名为 DeepSpeed Chat 的新工具——它执行获得完全 RLHF 模型所需的 3 步过程。这 3 个步骤是:监督微调、奖励模型训练和 RL 步骤。由于底层工具的强大功能,DeepSpeed Chat 比其他框架快 15 倍,并且可以扩展到具有数十亿参数的模型。

Wombat:从 RLHF 到 RRHF,以“正确”的方式调整人类偏好 (GitHub Repo)

新颖的 RRHF 学习范式有效地将语言模型输出与人类偏好对齐,需要更少的模型并提供更简单的 PPO 替代方案。在 LLaMA 和 Alpaca 数据集上进行评估,RRHF 展示了与 PPO 相当的性能,同时在训练中简化了对齐过程。

Engshell (GitHub Repo)

Engshell 是适用于任何操作系统的英语 shell,由 LLM 提供支持。

ChatGPT Concierge Bot (GitHub Repo)

这是一个使用 ChatGPT 和 Whisper AI 的 Telegram 机器人。


杂七杂八


日本读心术人工智能研究引发伦理争论

本文介绍了日本在 AI 研究方面的一项突破,它提出了读心技术的可能性,引发了关于潜在伦理问题以及对隐私、监视和个人自主权的影响的辩论。

Open-Source Leak 如何导致开源 ChatGPT 爆炸式增长

本文介绍了“骆驼效应”,这是 AI 研究中的一个意外发现,它导致机器学习模型和算法取得重大进展,最终彻底改变了该领域,并为 AI 应用带来了新的可能性。

我希望 GPT4 从未发生过

本文以非常人性化的视角审视了 GPT4 的经济影响

流媒体服务商敦促取缔AI音乐

环球音乐集团已告知包括 Spotify 和苹果在内的流媒体平台,阻止人工智能服务从其受版权保护的歌曲中抓取旋律和歌词。

分割网络上的任何内容

Web AI 使用 JavaScript 和 onyx 运行时在浏览器中运行 ML 模型。这是在浏览器中运行的流行段任何模型的示例。

一致性模型 (GitHub Repo)

这个 repo 包含 OpenAI 发布的最新一致性模型的代码库。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,393评论 5 467
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,790评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,391评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,703评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,613评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,003评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,507评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,158评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,300评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,256评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,274评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,984评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,569评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,662评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,899评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,268评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,840评论 2 339

推荐阅读更多精彩内容