数据科学简讯 2023-03-24


头条


GitHub Copilot X

Copilot 即将推出新的对话界面、GPT-4 升级、错误修复建议、文档编写和自动拉取请求。这些发布是 GitHub 成为开发者工具包强国目标的下一步。

谷歌和微软的聊天机器人在错误信息的对决中相互引用

根据 The Verge 上的一篇评论文章,微软、谷歌和 OpenAI 等大型科技公司仓促推出 AI 聊天机器人有可能破坏网络的信息生态系统。作者举了一个例子,微软的 Bing 聊天机器人错误地指出谷歌的 Bard 聊天机器人已经被关闭,并引用了一条推文、一条 Hacker News 评论和假新闻作为证据。这篇文章表明,人工智能语言模型无法区分事实与虚构,可能会在整个网络上释放出一系列错误信息和不信任,而且这些公司对机器人进行实验的免责声明是一种站不住脚的辩护。

Nvidia 进入基础模型即服务(foundation models as a service)

机器人、图像、文本、简历等等! Nvidia 已经将他们的帽子扔进了戒指。基础模型即服务将在企业领域首次亮相,为专有数据提供量身定制的解决方案。凭借其多模式功能,该平台可以处理一系列数据类型,包括文本、图像、视频,甚至 3D 内容,允许构建定制的多模式语言模型和生成模型以适应特定用例。与 Getty Images、Shutterstock 和 Adobe 等行业领导者的合作确保版权问题得到有效解决。


研究


我们其他人的 Data Deduplication

围绕重复数据删除的有用性争论的双方都有很多论文。无论如何,对同一个数据点进行 300,000+ 次训练似乎是一种浪费。这里一个简单的重复数据删除技术是嵌入你的数据点,聚类成 k(例如,10k 个聚类),然后删除与其他数据点具有非常高余弦相似性的子集。这种技术似乎对嵌入的选择和集群的数量很稳健,只要集群足够高。它也适用于各种模式。

Text to Room

从来没有一个社区比目前的生成 AI 社区对室内设计更感兴趣。这项工作非常符合当前的趋势。他们需要做很多新颖的调整才能使整个 3D 空间与提示对齐。总之,非常有趣的 3D 资产生成工作。

FreeDoM:一种无需训练的条件扩散模型

本文介绍了 FreeDoM,这是一种无需训练的条件扩散模型,它利用现成的预训练网络来构建与时间无关的能量函数,从而能够在各种条件下进行有效生成。所提出的方法在简单、有效和低成本方面具有优势,并且比现有的免训练方法具有更广泛的应用范围,如在不同数据域(包括图像和潜在代码域)上的实验所证明的那样。


工程


ChatLlama (Website)

围绕指令调整的Alpaca 模型的一个很好的包装器接口。目前只有 70亿参数模型可用,其他型号即将推出。虽然质量不及 ChatGPT,但它是一个有代码的有趣的开放替代方案。

Generative models for medical (GitHub Repo)

朝着评估、创建和管理生成模型迈出的重要一步,适用于各种任务,特别是医学。该项目旨在通过为生成性医疗任务构建工具来提供帮助,并提供指标和教程来帮助用户入门。


杂七杂八


人工智能是下一个技术垄断吗?

由于构建其中一些 AI 系统需要巨大的资金需求,因此尚不清楚它们是否会以人们希望的方式颠覆和带来创新。它们难以复制且不透明,但可以作为建立大量公司的基础。

Mozilla 推出专注于可信赖人工智能的新初创公司

Firefox 浏览器的开发商 Mozilla 正在启动一家 AI 初创公司,以构建开源且“值得信赖”的 AI。 Mozilla 执行总裁兼 Mozilla.ai 负责人 Mark Surman 表示,这家新成立的公司名为 Mozilla.ai,其使命不仅仅是构建任何人工智能——它的使命是构建开源且“值得信赖”的人工智能.

摩根斯坦利和 OpenAI

摩根士丹利正在使用 OpenAI 的 GPT-4 为内部聊天机器人提供支持,帮助财富管理人员查找相关信息。关于投资策略、市场研究和分析师见解的大量信息存放在许多内部网站上,主要以 PDF 格式提供,需要顾问浏览大量信息以找到特定问题的答案。该模型将对财富管理内容进行全面搜索,“有效解锁摩根士丹利财富管理的累积知识”。

斯坦福大学下架 Alpaca

斯坦福大学的研究人员以成本和安全问题为由取消了 Alpaca。

视频游戏开发商 Ubisoft 正在使用 AI 编写对话

流行视频游戏《刺客信条》的发行商育碧现在正在使用一种名为 Ghostwriter 的人工智能工具来帮助为其游戏编写对话。

Next.js ChatGPT (GitHub Repo)

Next.js ChatGPT 是一个负责任的聊天应用程序,由 GPT-4 提供支持。

The HustleGPT Challenge (GitHub Repo)

HustleGPT Challenge 是一个精选的 HustleGPT 列表。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,519评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,842评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,544评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,742评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,646评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,027评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,513评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,169评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,324评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,268评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,299评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,996评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,591评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,667评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,911评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,288评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,871评论 2 341

推荐阅读更多精彩内容