AI写的AI 日报|Vol. 20230331


1.产业新闻

科技领袖呼吁暂停人工智能6个月

包括埃隆·马斯克(Elon Musk)和史蒂夫·沃兹尼亚克(Steve Wozniak)在内的一群知名计算机科学家和行业专家呼吁暂停6个月,考虑推出具有“人类竞争智能”的人工智能系统的风险,这些系统可能会比人类更聪明。他们的请愿书由非营利组织Future of Life Institute组织,警告称这样的AI系统可能对社会和人类带来深刻的风险,包括在互联网上充斥着虚假信息,自动化职业等,以及更严重的未来风险。尽管这封信已经引起了怀疑者的质疑,但一些政府已经在努力监管高风险的AI工具。

Cerebras推出第一个在GPU上未经训练的计算最优GPT模型

GPU是训练大规模AI模型的主要硬件。许多团队正在努力开发定制的AI芯片。Cerebras拥有高吞吐量和芯片内存的CS-2系统。他们声称这项工作(111M – 13B参数模型)仅用了几周就完成了,这得益于他们芯片的强大性能。这与Llama项目的大约5个月形成对比(最多65B个参数)。它们被训练为“计算最优”,这意味着它们的功率不如相同大小的Llama模型。

微软限制竞争对手使用Bing搜索引擎

微软现在正在限制其AI聊天机器人竞争对手访问Bing搜索引擎。

2.研究动态

StyleDiffusion:基于提示嵌入反演的文本编辑

研究人员通过优化交叉注意力层中值线性网络的输入,并引入注意力正则化来解决预训练扩散模型在图像编辑方面的局限性。这些改进导致更出色的编辑能力,通过在各种图像上进行广泛的实验提示编辑进行了展示。

介绍GPT4All(GitHub仓库)

GPT4All是一个7B参数的语言模型,使用高质量的助理数据进行训练,并附带800k个数据样本、训练代码和模型权重,旨在开放研究和可重现性。还提供了一个4位量化版本,可以在CPU上运行。

尝试文本到视频(HuggingFace Space)

虽然这个演示只能一次生成8个帧,但它能很好地展示一些生成视频模型的能力。在这里仍然存在许多开放问题,如生成长度、一致性和世界知识,但事情正在发展。生成视频所需的计算量比图像或文本要高得多,因此这些模型往往运行较慢,训练时间更长。

为文本到3D模型添加一致性(GitHub仓库)

自从去年强大的文本到图像模型问世以来,人们一直在尝试从2D转向3D生成。其中一个问题是“多视角一致性”问题,即如果你只看到一个物体的一部分,如何推断其他部分的样子。许多简单粗暴的方法会在物体周围复制和粘贴2D图像,导致非常奇怪的图像。通过使用一种一致性注入技术,您可以利用2D模型的语义理解来创建相当稳健的3D模型。文本到3D打印的流程即将到来!

VIVE3D:使用3D感知GAN的视点无关视频编辑(GitHub仓库)

作者提出了VIVE3D,这是一种新技术,将基于图像的3D GAN的能力扩展到视频编辑。它使用针对相机参数进行优化的新型GAN反演技术,并引入了通过光流引导合成将头部与背景视频组合起来以显示新视图的新编辑方法,从而产生了从不同摄像机视角得出高保真度、一致质量的脸部编辑结果。

指导3D到3D:文本指导下的3D到3D转换(GitHub仓库)

Instruct 3D-to-3D是一种高质量的3D到3D转换方法,利用预训练的图像到图像扩散模型根据文本指令转换3D场景,同时保持一致性和可控性。定量和定性评估显示出与基线方法相比更优异的转换质量,还增加了动态缩放功能,以调整几何变换强度。

Lit-LLaMA(GitHub仓库)

Lit-LLaMA是一个完全开源的LLaMA模型。

3.延伸阅读

《注意力机制是你所需要的一切》(Not Boring)

OpenAI的强大AI ChatGPT正在转变为一个平台,可能会削弱和颠覆各种行业。随着插件和第三方集成的引入,ChatGPT可以吸收许多产品的功能,将它们转变为API,并为用户的需求创建一个一站式目的地。作为“顶尖聚合器”,ChatGPT有望简化用户体验,重塑消费者行为,并迫使企业适应,可能会影响其利润率和运营方式。

《AI风险并不等于AGI风险》

Gary Marcus认为,尽管AGI的风险仍然遥远,当前的AI LLM模型也存在其独特且严重的风险。

4.产品体验

Video2Recipe

https://video2recipe.com/

Video2Recipe是一种工具,允许用户通过粘贴视频URL将他们最喜欢的YouTube烹饪视频转换为食谱。然后,AI将为该食谱生成逐步说明和成分清单。

通常,带有烹饪过程音频描述的烹饪视频效果最佳。这意味着仅有音乐的视频无法转换为食谱。

Piggy Quiz Maker

https://piggy.to/magic

AI测验制作器的奇妙之处!只需一个提示,这个神奇的工具就可以创建一个令人惊叹的测验,由7-10个外观吸引人的问题组成,完美地优化了移动设备。告别繁琐的测验制作,迎接轻松的内容创作世界。Piggy Quiz Maker使得生成任何你能想到的主题的测验变得极其容易。在任何领域磨练你的技能,或者挑战你的朋友,看看谁是真正的魔术师。


发表回复