AI 每日跟踪｜20230322

1.产业新闻

网站：cn.bing.com/images/create

微软Bing近日上线了AI绘图产品-Image Creator，该功能由微软投资的 OpenAI 旗下的的 DALL-E 提供技术支持，用户只需提供Prompt（形容词）即可生成出各类的AI图片。目前Bing Image Creator无需排队，用户可以直接使用。但目前只支持使用英文描述词，并且生成的图片左下角都会有 Bing 的logo水印。

Runway宣布推出Gen-2（产品发布）

Runway宣布推出Gen-2，这是一个多模态AI系统，可以从文本生成逼真的视频。您可以在4种不同的模式下使用Gen-2：文本到视频、图像到视频、文本+图像到视频（使用驾驶图像和文本提示生成视频）、样式化（视频到视频）和故事板（将模型转化为全面的样式化和动画渲染）。请查看网站上的示例，如“山脉的航拍无人机镜头”和“纽约市阁楼的傍晚阳光透过窗户”。

Zapier推出自然语言操作（产品发布）

Zapier推出了一个名为自然语言操作(NLA)的通用、基于人工智能的API，以将Zapier操作集成到任何应用程序中。NLA针对基于自然语言的产品进行了优化，例如聊天机器人或使用LLM构建的产品，但任何开发者都可以使用它。将Zapier的5,000多个应用程序和20,000多个操作放入你的产品中，并使用简单的自然语言在应用程序之间移动信息。

稳定扩散再想象

Stability AI宣布推出Stable Diffusion Reimagine，这是一个新的Clipdrop工具，允许用户生成单个图像的多个变体，而没有任何限制。无需复杂的提示 – 用户可以将图像上传到算法中，创建任意数量的变体。

语音克隆人工智能让你说多种语言

微软的新人工智能模型VALL-E X可以从4-10秒的简短样本中克隆声音，并用它来合成不同语言的语音。

2.研究动态

DiffusionRet：扩散模型生成的文本-视频检索

该论文介绍了DiffusionRet，一种基于扩散的文本-视频检索框架，从生成视角建模文本和视频之间的相关性，即它们的联合概率p(candidates, query)。DiffusionRet通过生成损失和对比损失来优化生成器和特征提取器，利用生成和判别方法实现卓越的性能，即使在域外检索设置下也能在五个常用的文本-视频检索基准测试中取得优异的表现，并为相关领域带来了基本的见解。

用85,000美元训练一个ChatGPT竞争者，并在浏览器中运行它

根据Llama论文的计算，你可以使用纯公共数据集在A100 GPU上进行82000 GPU小时的训练，从而可以使用自我教导来进一步调整模型，从而拥有一个与最先进的模型相竞争的开放式语言模型。

LION：隐式视觉提示调整

该论文提出了LION，一种高效的视觉模型，通过使用具有稳定内存成本的深度隐式模型，解决了视觉Transformer的高计算成本问题。LION仅在预训练的主干骨架中插入两个平衡的隐式层，并根据彩票假说对参数进行剪枝，减少了高达11.5％的训练参数数量，同时在广泛的数据集上取得了比最先进的基线VPT更高的性能，特别是在具有挑战性的场景下。

Semantic Kernel（GitHub Repo）

语义内核（SK）是一个轻量级的SDK，可将AI LLM与传统编程语言集成。

哪些数据让我的模型更聪明？

不使用加法标量分数来确定数据实例对最终模型性能的影响有多大，如果我们使用完整的训练模拟器呢？这使得可以在数据集构建和长期训练性能方面进行反事实探索。这种方法往往会低估性能，但在大型语言模型训练运行中很好地捕捉到一般性动态。

3.衍生阅读

OpenAI CEO和CTO谈风险以及AI将如何重塑社会

Sam Altman（OpenAI CEO）和Mira Murati（CTO）在接受ABC采访时谈到了AI和AGI对社会的影响。 Altman表示，通过让真实用户使用他们的产品进行AI测试，并在风险较低的情况下犯错误，这一点非常重要。

斯坦福大学以不到600美元的价格复制了ChatGPT AI

斯坦福研究人员已经创建了Alpaca，该系统的功能类似于ChatGPT，但成本不到600美元。

让我们思考减缓人工智能的发展旧文推荐

本文探讨了是否应该采取措施来减缓人工智能（AI）研究的进展。应该更多地考虑这可能是必要的可能性。本文探讨了减缓人工智能发展的支持和反对的论点，并考虑了继续加速该领域进展的后果。它提出了关于人工智能研究轨迹和我们对其潜在影响对社会的责任的问题。

GPT如何影响劳动力市场

虽然GPT模型可能会影响劳动力市场，但其影响并不是对所有工作都均等的。初步研究表明，需要身体活跃和头脑创意的工作不太可能受到大型语言模型的影响。虽然这种方法并不是最具说服力的方法，但在这个早期阶段，这是了解我们经济未来可能会出现的情况的重要一步。

Duolingo和OpenAI

Duolingo推出了两个由OpenAI的GPT-4支持的新功能：Role Play，即AI对话伙伴，和Explain my Answer，提供关于错误的上下文反馈，在一个名为Duolingo Max的新订阅层中。在发现GPT-3无法自信地处理聊天的复杂自动化方面之后，Duolingo转向了GPT-4。团队看到了GPT-4提供比以往更有效和吸引人的学习体验的潜力，这应该会改善学习结果，并简化整个工程流程，使其更快地将新功能带给用户。

🤗 划重点

我们认为现在的AI资讯太过于碎片化，大家很难高效的获取高密度的有用信息。

所以我们开始采用人工+GPT结合的形式做日报产品（demo），近期会迭代转变为纯AI输出的产品。

如果读者朋友在使用过程中遇到问题，或者对内容本身有更多的需求，又或者是一些优化建议，欢迎点击👉加入👇下方微信群提出你的宝贵建议，非常感谢！

AI 每日跟踪｜20230322

1.产业新闻

2.研究动态

3.衍生阅读

🤗 划重点

发表回复 取消回复

发表回复取消回复