头条
Discord 正在测试基于 ChatGPT 的 Clyde 聊天机器人和其他人工智能功能
Discord 现在正在使用 OpenAI 的 ChatGPT 技术将其现有的 Clyde 机器人转变为健谈的聊天机器人。 Clyde 将在下周进行升级,以回答问题并与用户进行对话,就像 OpenAI 的 ChatGPT 或微软的 Bing 聊天功能一样。这是在 Discord 中更广泛推动 AI 的一部分,其中还包括 AI 生成的对话摘要以及 Discord 管理员利用 AI 技术调节服务器的能力。
开源 ChatGPT 复制训练有 4300 万条指令
chatGPT 如此强大的原因之一是指令调整过程。通过提供格式化为指令的模型数据,它变得更有可能遵循用户给出的指令。 Openchatkit 是一个 200 亿参数指令调整的 Transformer 和其他有用的工具,用于对功能强大且流行的聊天机器人进行开源复制。
微软德国称 GPT-4 将于下周推出
微软德国首席技术官 Andreas Braun 表示:“我们将在下周推出 GPT-4,在那里我们将拥有多模式模型,将提供完全不同的可能性——例如视频,”Braun 说。 CTO 称 LLM 为“游戏规则改变者”,因为他们教机器理解自然语言,然后机器以统计方式理解以前只能由人类阅读和理解的内容。
研究
仅有30分钟交互数据的樱桃采摘机器人
数据效率是许多强化学习算法面临的挑战之一。在代理开始学习之前,通常需要数百万次环境交互。这对于现实世界的机器人系统来说通常是不可行的。这项工作是数据效率更高的系统的一个例子。
PixMIM:一种简单有效的蒙版图像建模方法
该论文提出了 PixMIM,这是一种简单有效的蒙版图像建模 (MIM) 方法,解决了两个以前被忽视的瓶颈。 PixMIM 从重建目标中过滤掉高频成分,并采用保守的数据变换策略来缓解 MIM 训练中丢失前景的问题。该方法可以轻松集成到大多数现有的基于像素的 MIM 方法中,无需额外计算即可在各种下游任务中一致地改进三种 MIM 方法。 PixMIM 可以作为自我监督学习的强大基线,并为 MIM 框架的未来改进提供见解。
工程
在笔记本电脑上运行最先进的语言模型 (GitHub Repo)
通过利用新的 Apple 神经计算系统,您可以在 m1 和 m2 计算机上运行 llama 模型。对于最小的模型,您甚至可以每秒获得许多令牌。这指向了在消费级硬件上运行的个性化 AI 的激动人心的未来。
运行语言模型的简单方法
在上述代码的支持下,这个项目很好地打包了东西,并允许您使用熟悉的网络工具(如 npx)安装和运行 llama 模型。
Text-Generation-Webui (GitHub Repo)
这个 GitHub Repo 是一个 gradio web UI,用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型。
杂七杂八
将 PEFT 与 RLHF 相结合
参数有效微调 (PEFT) 是一种仅更新模型权重的一小部分的方法。从人类反馈中强化学习 (RLHF) 是与指令调整类似的步骤,可提高模型生成质量和模型对齐。通过结合两者,您可以在具有 24GB 片上内存的相对较小的 GPU 上调整多达 200 亿个参数的大型模型。此过程通常需要多个 A100。
ChatGPT 的 API 使大多数文本生成 AI 过时
ChatGPT 的 API 非常好,而且非常便宜,以至于它让大多数其他文本生成 AI 模型都过时了。 3 月 1 日,OpenAI 将 ChatGPT API 的价格设置为 GPT-3 API 的 1/10,即 0.002 美元/1,000 个代币。将此与模型的可定制性与及时工程相结合,您将拥有一项将颠覆许多行业的技术。
ChatGPT 现在可在 Azure OpenAI 服务中使用
随着微软将 ChatGPT API 服务集成到微软的云计算平台 Azure,OpenAI 与微软的合作关系不断加深。
大型语言模型正处于稳定的扩散时刻
本文深入探讨了大型语言模型如何在创新和流行方面呈爆炸式增长,类似于 2022 年 8 月发布稳定扩散后生成式人工智能的爆炸式增长。
Toolbox (GitHub Repo)
这个 GitHub Repo 是机器学习指南和工具的组合。
用 ML 开发的 Pan-Variant COVID 疫苗
在机器学习的帮助下,已经开发出一种新的全变体 COVID 疫苗,可以结束对加强剂和季节性变体疫苗的需求。