fine-grained token
像一张可以细分权限的会员卡,不是随便的通票。
Providers 导读
这一页教你用 Hugging Face 的 Inference Providers 路由,一个 token 就能用 DeepSeek、Llama、Qwen 等模型。先创建带「Make calls to Inference Providers」权限的 fine-grained token,然后运行 `openclaw onboard` 选择 Hugging Face 并输入 token。最容易错的是 token 权限没勾对,API 会直接拒绝。
先讲这一页到底在解决什么
这一页教你用 Hugging Face 的 Inference Providers 路由,一个 token 就能用 DeepSeek、Llama、Qwen 等模型。先创建带「Make calls to Inference Providers」权限的 fine-grained token,然后运行 `openclaw onboard` 选择 Hugging Face 并输入 token。最容易错的是 token 权限没勾对,API 会直接拒绝。
第一步
这页不是让你随便拿个 token 来试,而是要拿对那种带 Inference Providers 调用权限的票。
像一张可以细分权限的会员卡,不是随便的通票。
openclaw onboard --auth-choice huggingface-api-key像在前台登记:“我要进 Hugging Face 模型超市,这是我的会员卡。”
HUGGINGFACE_HUB_TOKEN / HF_TOKEN这两个像同一张会员卡的两个常见标签。
先拿对票,后面超市货架才会真的向你打开。
第二步
官方这页花了很多字讲 GET /v1/models。翻成人话,其实就是商品目录刷新。
GET https://router.huggingface.co/v1/models像 OpenClaw 先去看超市今天货架上到底摆了什么,而不是盲猜。
因为它已经先去拿了一次货架清单,所以能让你直接选默认商品。
像今天超市目录机坏了,那就先用内建的小目录,不至于完全摸黑。
HF 的模型列表不是写死的,像会刷新的商品货架。
第三步
:fastest、:cheapest、:provider 像“买同一件货时的购物策略标签”这是这页最容易看晕、但其实最好玩的地方。
:fastest像你告诉超市:“我不挑哪家仓库发货,反正给我最快送到。”
:cheapest像说:“同样这件货,谁家最便宜就从谁家拿。”
:provider像你点名:“这件货我就要这家供货商发,别帮我自动挑。”
因为你已经贴了 :fastest 或 :cheapest,那就等于你把“具体哪家发货”这件事交给路由器决定了。
第四步
模型原名有时很长,官方允许你自己起更顺手的展示名。
比如 huggingface/deepseek-ai/DeepSeek-R1:cheapest 这种长名字,你完全可以给它贴成 “DeepSeek R1(便宜版)”。这样以后在 CLI 和界面里更像人话,而不是仓库条码。
最后总结
Hugging Face 像一个大模型超市:一张 token 进门,OpenClaw 先看今天货架,再让你决定买得快一点、便宜一点,还是指定供货商。