AI写的AI 周报｜Vol. 20230402

1.产业新闻

Databricks发布了开源聊天机器人,挑战OpenAI的ChatGPT的主导地位

Databricks,一家总部位于旧金山的创业公司,周二发布了一款开源聊天机器人,旨在挑战OpenAI开发的ChatGPT在自然语言处理领域的主导地位。Databricks声称,与ChatGPT相比,其聊天机器人在一系列任务中取得了更好的结果,显示出Databricks认为它可以与OpenAI的知名语言模型竞争。Databricks的做法反映出大型语言模型的竞争正在加剧,各公司均在试图推出自己的版本,以吸引开发者和媒体的关注。

Sam Altman接受| Lex Fridman的播客访谈

Sam Altman的最新播客访谈，谈了关于GPT-4、ChatGPT和人工智能未来的一系列方案

Character AI的新模型和新资金

这家鼓励你与AI聊天机器人交流的初创公司在最新一轮融资中获得了资源的提升。真正的对话代理人是一种强大且危险的技术。他们希望安全地为每个人构建它们。

Sam Altman 表示 ChatGPT 数据库中存在固有的偏见

这篇文章报道了 OpenAI CEO Sam Altman 的一份声明，涉及用于开发 ChatGPT 语言模型的训练数据中存在的固有偏见，强调了需要更多多样化的数据和在人工智能开发中考虑伦理的必要性。

Nvidia CEO 黄仁勋就人工智能的“iPhone 时刻”接受采访

作者本·汤普森采访了 Nvidia CEO Jensen Huang，谈到了他所称的人工智能的“iPhone 时刻”——ChatGPT——以及它如何影响了Nvidia的业务。当被问及 Nvidia 在 ChatGPT 后是否有所不同时，Huang 表示：“推断。推断的规模已经经历了一个跨越式的发展，毫无疑问，目前正在进行的推断类型是针对视频进行生成AI的增强，无论是增强背景、增强主体、重新照明面部、进行眼部重置、增加有趣的图形等等。所有这些生成AI工作都是在云端完成的，因此视频具有生成AI。”

苹果收购WaveOne

苹果收购了 WaveOne，这是一家正在开发用于压缩视频的AI算法的初创公司。

Google与AI初创公司Replit合作，以对抗微软的GitHub

谷歌与AI初创公司Replit合作，将其AI语言模型与Replit的Ghostwriter软件相结合，以帮助程序员编写代码。这一合作旨在与微软的GitHub Copilot竞争，后者使用OpenAI的语言生成AI。Ghostwriter将使用谷歌的AI来改进代码建议、程序完成和回答开发者问题。Replit计划通过提供端到端的代码编写、测试、部署、应用程序审查和协作支持来增强其软件。该合作还将使Replit扩大其对谷歌云服务的使用和软件分发。

Perplexity AI的A轮

AI搜索领域的一家领先创业公司推出了iPhone应用程序并筹集了额外的资金。他们的目标是成为知识发现领域的领导者。我们将看到哪些服务找到区别，但仅几个月内就有200万用户的增长是令人印象深刻的。

科技领袖呼吁暂停人工智能6个月

包括埃隆·马斯克（Elon Musk）和史蒂夫·沃兹尼亚克（Steve Wozniak）在内的一群知名计算机科学家和行业专家呼吁暂停6个月，考虑推出具有“人类竞争智能”的人工智能系统的风险，这些系统可能会比人类更聪明。他们的请愿书由非营利组织Future of Life Institute组织，警告称这样的AI系统可能对社会和人类带来深刻的风险，包括在互联网上充斥着虚假信息，自动化职业等，以及更严重的未来风险。尽管这封信已经引起了怀疑者的质疑，但一些政府已经在努力监管高风险的AI工具。

微软限制竞争对手使用Bing搜索引擎

微软现在正在限制其AI聊天机器人竞争对手访问Bing搜索引擎。

Zoom IQ（AI智能伴侣）推出新功能并与OpenAI合作

Zoom正在扩展其AI功能，通过整合专有的AI模型并利用来自公司如OpenAI的外部模型。下一代AI智能伴侣Zoom IQ旨在通过总结聊天线程、起草内容和创建会议议程来增强协作和简化工作流程。随着这些功能向选择的客户推出，Zoom IQ旨在为个人和团队节省时间并增强创造力。

Midjourney停止提供免费试用

由于一些AI生成的图像的病毒性和新用户的激增，Midjourney将停止提供免费试用。

2.研究动态

微软计划使用人工智能解决医生们的一个巨大痛点

微软旗下的Nuance Communications正在开发一种基于人工智能的临床记录工具，名为Dragon Ambient eXperience (DAX) Express，旨在减轻医生繁琐的文书工作流程。该工具采用了对话、环境和生成AI的独特组合，可以自动安全地创建草稿临床记录，为每个患者就诊后的立即临床审查和完成而制定。微软计划利用其在人工智能和Chat-GPT方面的工作，将这个工具推向一个新的水平。如果成功，该工具将大大改善医疗保健交付，减轻医生工作负担。

生成检索推荐系统

大多数深度推荐系统通过对产品进行嵌入，然后进行某种最近邻检索来工作。这里有利有弊。这项新工作使用序列到序列模型和离散产品嵌入来推荐顾客互动序列中的下一个产品。它比一些强基线模型提高了高达17%的性能。

ReVersion：基于扩散的关系倒置图像

作者提出了一个新任务——关系倒置：给定一些示例图像，其中每个图像中都存在一个关系，我们的目标是找到一个关系提示来捕捉这种交互，并将关系应用于新实体以合成新场景。

BlenderGPT（GitHub 仓库）

Blender 是一款流行的免费开源 3D 建模软件，具有极强的功能，并且方便地提供了 Python 接口。您可以将此接口连接到诸如 GPT-4 等语言模型上，并让它们为您编写代码，以自动化不同的 3D 建模任务。自述文件中包含一个视频，展示了它的使用方式。

Anthropic 插件（GitHub Gist）

与下一个操作系统相比，语言模型的插件已经被比作下一个操作系统。事实证明，将功能移植到不同的语言模型之间很容易，因为所有的东西都是文本。

EVA-CLIP: 改进 CLIP 大规模训练技术

这篇论文介绍了 EVA-CLIP，这是一组显著提高 CLIP 训练效率和效果的模型。与先前的模型相比，EVA-CLIP 在相同数量的参数下实现了更好的性能，同时还具有更小的训练成本，完整套件已发布供开放研究使用。

Text2Video-Zero，一种零样本文本到视频生成方法（GitHub 仓库）

本文通过修改现有的文本到图像合成方法，介绍了一种低成本的零样本文本到视频生成方法。该方法使用运动动态增强潜在代码，并重新编程帧级自注意力以保留前景对象的上下文、外观和身份，从而实现高质量、一致的视频生成，无需额外的视频数据。该方法也适用于其他任务，如条件和内容专业化的视频生成和指导式视频编辑。

StyleDiffusion：基于提示嵌入反演的文本编辑

研究人员通过优化交叉注意力层中值线性网络的输入，并引入注意力正则化来解决预训练扩散模型在图像编辑方面的局限性。这些改进导致更出色的编辑能力，通过在各种图像上进行广泛的实验提示编辑进行了展示。

指导3D到3D：文本指导下的3D到3D转换（GitHub仓库）

Instruct 3D-to-3D是一种高质量的3D到3D转换方法，利用预训练的图像到图像扩散模型根据文本指令转换3D场景，同时保持一致性和可控性。定量和定性评估显示出与基线方法相比更优异的转换质量，还增加了动态缩放功能，以调整几何变换强度。

Lit-LLaMA（GitHub仓库）

Lit-LLaMA是一个完全开源的LLaMA模型。

3.衍生阅读

人工智能可能有助于搜索外星生命

本文讨论了如何使用人工智能在火星上寻找外星生命，通过分析来自行星表面和大气的海量数据，识别可能表明存在生命的模式。

生成式 AI 可能影响 3 亿个工作岗位

高盛报告称，生成式 AI 可能会影响多达 3 亿个工作岗位。

Roblox 正在整合生成式 AI

本文探讨了生成式 AI 在游戏创作平台 Roblox 中的应用，并讨论了这如何塑造游戏开发和元宇宙的未来。

《注意力机制是你所需要的一切》（Not Boring）

OpenAI的强大AI ChatGPT正在转变为一个平台，可能会削弱和颠覆各种行业。随着插件和第三方集成的引入，ChatGPT可以吸收许多产品的功能，将它们转变为API，并为用户的需求创建一个一站式目的地。作为“顶尖聚合器”，ChatGPT有望简化用户体验，重塑消费者行为，并迫使企业适应，可能会影响其利润率和运营方式。

《AI风险并不等于AGI风险》

Gary Marcus认为，尽管AGI的风险仍然遥远，当前的AI LLM模型也存在其独特且严重的风险。

谷歌否认Bard是使用ChatGPT数据训练的

谷歌否认了Bard聊天机器人是使用ChatGPT数据进行训练的报道。

AI的寒武纪时期

本文将当前AI发展状态与地球生命史上的寒武纪时期进行了比较，讨论了AI技术的快速多样性和进化以及该领域可能迎来的新时代的创新和进步。

GPT越狱者称他们正在防止封闭源AI的反乌托邦

本文报道了“越狱GPT”的开发，这是一个开源语言模型，旨在复制OpenAI的GPT模型的能力，并解决后者封闭源和局限性的问题。