跳到主要内容

fara_microsoft

fara GitHub Repo stars

Fara-7B为微软70亿参数计算机智能体模型。基于Qwen2.5-VL-7B。

核心机制:直接视觉感知网页。预测坐标控制鼠标键盘(点击/滚动/输入)。无需无障碍树与解析模型。 主要功能:自动化Web任务。执行信息搜索、表单填写、票务预订、购物比价、房产/求职浏览。 项目优势:支持端侧部署。保障数据隐私。降低延迟。任务执行步骤少。同尺寸模型性能SOTA。 配套资源:发布WebTailBench(真实Web任务基准)与CUAVerifierBench(裁判模型评估基准)。包含完整测试与评估脚本。