🔥🔥🔥本篇笔记所对应的视频:https://youtu.be/QNZZJvGnk80
Magentic-One
环境配置
# 安装 Homebrew(如果没有)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
# 安装 Python3(如果没有)
brew install python# 安装 ffmpeg(用于音视频处理)
brew install ffmpeg# 确保 Docker 已安装并运行
安装
# 1. 克隆代码仓库
git clone https://github.com/microsoft/autogen.git
# 2. 进入项目目录
cd autogen/python/packages/autogen-magentic-one# 3. 安装项目依赖
pip3 install -e .# 4. 安装 playwright 及其依赖
playwright install --with-deps chromium
配置OpenAI
export CHAT_COMPLETION_PROVIDER='openai'
export CHAT_COMPLETION_KWARGS_JSON='{"api_key": "YOUR_API_KEY", "model": "gpt-4o-2024-05-13"}'
开启搜索功能
export BING_API_KEY=xxxxxxx
运行
# 进入项目目录
cd ~/autogen/python/packages/autogen-magentic-one
# 基本运行(需要指定日志目录)
python3 examples/example.py --logs_dir ./my_logs# 启用人工监督模式
python3 examples/example.py --logs_dir ./my_logs --hil_mode# 保存浏览器截图
python3 examples/example.py --logs_dir ./my_logs --save_screenshots
👉👉👉如有问题或请联系我的徽信 stoeng
🔥🔥🔥本项目代码由AI超元域频道制作,观看更多大模型微调视频请访问我的频道⬇
👉👉👉我的哔哩哔哩频道
👉👉👉我的YouTube频道
👉👉👉我的开源项目 https://github.com/win4r/AISuperDomain
充值openai api key或者ChatGPT会员可以使用wildcard虚拟卡充值。wildcard官方链接:
wildcard注册教程和充值API教程(国内打开速度快):
wildcard注册教程和充值API教程(海外打开速度快):
https://stoeng.medium.com/保姆级教程-通过wildcard虚拟信用卡订阅chatgpt-claude会员和api-百分百可用-a2865a18df01
# 克隆代码仓库
git clone https://github.com/microsoft/autogen.git
cd autogen/python/packages
# 按顺序安装所需的子包
# 1. 安装 autogen-core
cd autogen-core
pip install -e .# 2. 安装 autogen-ext
cd ../autogen-ext
pip install -e .# 3. 安装 autogen-magentic-one
cd ../autogen-magentic-one
pip install -e .# 4. 安装 playwright 及其依赖
sudo python3 -m playwright install --with-deps chromium# 5. 修复 playwright 缓存目录权限
sudo chown -R $USER:$USER ~/Library/Caches/ms-playwright# 设置 OpenAI 配置
export CHAT_COMPLETION_PROVIDER='openai'
export CHAT_COMPLETION_KWARGS_JSON='{"api_key": "你的API密钥", "model": "gpt-4o-2024-05-13"}'# 如果需要使用网页搜索功能,设置 Bing API
export BING_API_KEY=你的必应API密钥# 进入项目目录
cd ~/autogen/python/packages/autogen-magentic-one# 基本运行(必须指定日志目录)
python3.11 examples/example.py --logs_dir ./my_logs# 可选参数:
# 启用人工监督模式
python3.11 examples/example.py --logs_dir ./my_logs --hil_mode# 保存浏览器截图
python3.11 examples/example.py --logs_dir ./my_logs --save_screenshots
Magentic-One 是微软开发的一个通用多智能体系统,专门用于解决跨领域的开放式网络和文件任务。它代表了 AI 从对话模式向代理模式的重要转变,目标是完成人们在工作和生活中遇到的复杂任务。
想象一下,当你需要整理一份文献综述时,不再需要手动搜索、阅读、筛选和总结数十篇论文;
当你想订一份外卖时,不用自己打开应用、挑选菜品、填写地址;当你需要分析一组数据时,不必亲自编写每一行代码。
这一切,都可以交给微软最新发布的革命性项目 Magentic-One 来完成。
在具体应用中,比如订购电影票时,Magnetic-One会动态调用一系列代理:一个浏览器代理用于导航到订票网站,一个视觉识别代理用于解读图标,一个任务分解代理来顺序安排步骤,最后一个财务代理负责付款。
整个过程中,Orchestrator持续监控和评估代理的进展,根据需要调整方案,以避免不必要的重复步骤,确保任务的高效完成。
最令人惊叹的是,Magentic-One 在多个权威测试基准上都展现出与专用系统相当的性能,却无需任何定制化修改。
这意味着它是一个真正的通用型助手,可以帮助你完成从学术研究到日常生活的各种复杂任务。
无论是撰写研究报告、分析数据集、开发软件,还是订餐、购物、预约服务,Magentic-One 都能胜任。
这不仅仅是一个 AI 工具的升级,而是 AI 助手向真正的智能代理转变的里程碑。
它标志着 AI 技术从”能聊天”到”能干活”的重大跨越,开启了 AI 辅助人类工作和生活的新纪元。