AI 每日跟踪｜20230321

1.产业新闻

微软推出了一个名为Copilot for Work的新AI工具，旨在帮助用户在工作中变得更加高效、有创造力和有技能。它将大型语言模型与Microsoft Graph和Microsoft 365应用程序中的用户数据集成在一起，允许用户创建、分析、表达、协作和取得更多成果。

Stripe和OpenAI合作

Stripe和OpenAI合作，通过GPT-4增强Stripe的功能，以实现OpenAI的旗舰产品的商业化。OpenAI的产品和合作副总裁Peter Welinder表示：“我们很高兴与Stripe合作，将我们的旗舰产品商业化。除了支付外，Stripe 还帮助我们处理从循环计费和税务合规到自动化我们的财务运营的所有事务。”

PwC使用生成式AI进行法律工作

普华永道（PwC）宣布与人工智能初创公司Harvey建立了全球合作伙伴关系，为PwC的法律业务解决方案专业人员提供独家访问（在四大会计师事务所中）。Harvey是一个使用机器学习自动化和增强法律工作的平台，由OpenAI创业基金支持。Harvey将根据大量数据生成见解和建议，提供更丰富的信息，使PwC专业人员能够更快地识别解决方案。所有输出内容都将由PwC专业人员进行监督和审核。

这款经济实惠的设备将让任何人将他们的大脑连接到电脑上

PiEEG是一款经济实惠、易于维护的脑电图设备，可添加到Raspberry Pi 3或4型号的主板上。它能够测量脑电活动。PiEEG可用于各种项目，例如控制机器人或机械肢体、睡眠控制、冥想控制和测谎。它的成本在250美元至350美元之间，比一些类似设备更便宜。

你能用85000美元培训一个超过ChatGPT的模型，并在浏览器上运行吗？

现在可以使用不到85000美元训练一个类似于GPT-3的大型语言模型。很快可能可以完全在浏览器中运行语言模型。Meta研究的LLaMA提供了一个可由其他团队复制的GPT-3级模型。最小的模型LLaMA-7B在A100-80GB GPU上进行了82432小时的训练，每小时的成本约为1美元。微调模型的成本可以少于100美元。

哥伦比亚大学的研究人员推出了ViperGPT，旨在改善计算机对图像提出问题并回答的方式。

目前，大多数用于此任务的系统称为端到端模型，在从图像中解释和推广信息方面存在局限性。ViperGPT通过将任务分解为较小、可管理的部分，提供了一个有希望的替代方案。

简单来说，ViperGPT通过将较小的程序（如构建块）组合起来，为特定的关于图像的问题创建一个定制化的解决方案。它通过生成Python代码来执行这些较小程序的正确组合来实现这一点。这种方法不需要额外的训练，并在各种视觉任务上表现出色。

通过结合ViperGPT和GPT-4的优势，我们可以期望更强大的用于图像解释和分析的人工智能工具。例如，一个同时使用ViperGPT和GPT-4的系统可以有效地分析图像、图表或屏幕截图，同时针对查询生成准确和相关的文本信息。

这可能会显著改善我们在各个行业与人工智能驱动的应用程序交互的方式，例如教育、医疗保健和为视觉障碍者提供的可访问性服务。

2.研究动态

探究GANsformer：GAN的一种变体用于图像生成

本文讨论了作者对GANformer的复制和评估，这是一种用于图像生成的生成对抗网络（GANs）的变体。他们成功地重新创建了模型的两个变体，并发现了他们的结果与作者的结果之间的差异，以及两个未公开的程序变体。

HuggingFace支持LLaMA（GitHub仓库）

Meta的开源模型，其权重本月早些时候被泄漏，现在已包含在流行的Transformers库中，目前仅在主分支上，但现在可以使用该模型训练Stanford的Alpaca，使用他们的训练代码。

BiFormer：带有双层路由注意力的视觉Transformer（Github仓库）

本文讨论了注意力作为捕捉视觉Transformer中长距离依赖的强大工具，但强调了其高计算负担和内存占用的挑战。为了解决这个问题，作者提出了一种通过双层路由实现动态稀疏注意力的方法，允许灵活的计算分配和内容感知。所提出的BiFormer模型利用双层路由注意力，展现了在各种计算机视觉任务中良好的性能和高计算效率。

3.衍生阅读

GPT-4真的能生成2万5000字吗？

GPT-4的能力无疑令人印象深刻。然而，尽管OpenAI提出了令人印象深刻的声明，但人们对于GPT-4的最大输出容量提出了担忧，特别是在其所宣传的25,000字处理能力方面。

OpenAI声称，GPT-4的令牌限制大约为24,000个单词，或者32,000个令牌。然而，自模型于周二发布以来，用户报告称在限制范围内处理大型文本段时遇到了困难，尽管他们已经购买了ChatGPT Plus订阅。

这些困难似乎源于令牌限制同时考虑了输入和输出令牌，需要用户仔细管理其文本提交以避免超过限制。一些人认为，ChatGPT Plus用户当前可用的令牌限制更接近于4,000个单词，远低于所宣传的容量。目前，ChatGPT接口缺乏告知用户其文本提交限制的直观方式，迫使他们依靠试错来确定适当的长度。这个问题加剧了确定给定文本的实际令牌计数的困难，这包括空格，并且取决于所使用的语言。

为了解决限制和用户体验挑战，GPT-4用户社区提出了几种解决方案：

将文本分成较小的段落可以避免超过令牌限制，但会增加用户的复杂性。
确保在API调用中使用正确的模型版本可能会缓解一些令牌限制问题。
通过提供文本分析功能或直观的指导系统来改善用户体验，使用户能够更好地理解GPT-4的处理能力并避免错误。

产品介绍：

Fiction.com是一个新平台，可以制作定制的AI生成图像和头像。用户可以使用专用的AI服务器对其自定义模型进行无限次修订。

使用Fiction，用户可以创建：

定制头像：为自己或朋友创建个性化的AI生成头像。

客户模拟：训练一个能够理解特定设计风格或概念的模型，然后为客户呈现各种想法。

视频编辑：Fiction还包括Stable Diffusion WebUI和其他专业的AI工具。您可以使用这些工具创建视频、编辑图像等。

🤗 划重点

我们认为现在的AI资讯太过于碎片化，大家很难高效的获取高密度的有用信息。

所以我们开始采用人工+GPT结合的形式做日报产品（demo），近期会迭代转变为纯AI输出的产品。

如果读者朋友在使用过程中遇到问题，或者对内容本身有更多的需求，又或者是一些优化建议，欢迎点击👉加入👇下方微信群提出你的宝贵建议，非常感谢！

AI 每日跟踪｜20230321

1.产业新闻

2.研究动态

3.衍生阅读

🤗 划重点

发表回复 取消回复

发表回复取消回复