Transformers Agents 里面提供了诸多实用的工具,包括目前 AI 技术应用广泛的文档问答、文本转语音、文本生成图像、网站内容总结、图像分割等一系列工具。
开发者只需完成工具链组装,即可实现许多强大的功能。
比如,你可以通过它,快速实现这么一个功能:
用脚本根据链接,自动抓取某篇文章内容,并生成摘要,再将其翻译成任意一种语言,让 AI 朗读稿件,有需要的话,你还可以让代理为你生成一张配图。
一个基于 AI 能力,可快速报道各种新鲜资讯的播客系统,便能横空出世!
安装 & 使用
首先,打开 Hugging Face 提供的 Colab 地址:
https://colab.research.google.com/drive/1c7MHD-T1forUPGcC_jlwsIptOzpG3hSj
点击「播放」按钮,运行设置,可以看到 Transformers 指定了 v4.29.0 的最新版本,因为目前这个 Agents API,还在实验阶段,所以只在新版本提供支持:
等待一两分钟后,它便会弹出输入框。我们需要在这里填入 Hugging Face 提供的 Token。
Token 可到这个地址生成:https://huggingface.co/settings/tokens
填写完成后,点击「Login」登录。
然后再执行下一步,运行并初始化一个 Agent:
运行完成,会生成一个输入框,在这里填写 OpenAI 的 API Key。
API Key 可在这里生成:https://platform.openai.com/account/api-keys
输入完成后,按下回车键,让代码读取 API Key:
当你看到提示「OpenAI is initialized ?」时,表示代理的初始工作已经完成。
你可以在该 Colab 中,体验 Transformers Agents 的各项功能。
比如,最常见的,基于文本生成图像。让代理给我们生成一张漂浮在水面上的船:
agent.run(“Generate an image of a boat in the water”)
它便会遵循 Prompt 指令,开始自动生成图像:
Hugging 官方在 Colab 中给出了不少示例,包括为图像生成标题、根据文本生成语音、用对话模式跟图像交流等等,有时间的话,大家也可以逐个试玩一下。