惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
J
Java Code Geeks
雷峰网
雷峰网
WordPress大学
WordPress大学
宝玉的分享
宝玉的分享
云风的 BLOG
云风的 BLOG
V
Visual Studio Blog
V
Vulnerabilities – Threatpost
S
Securelist
The Hacker News
The Hacker News
The Register - Security
The Register - Security
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Help Net Security
Help Net Security
G
Google Developers Blog
Hugging Face - Blog
Hugging Face - Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
M
MIT News - Artificial intelligence
AI
AI
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
The GitHub Blog
The GitHub Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Schneier on Security
Schneier on Security
N
Netflix TechBlog - Medium
T
The Blog of Author Tim Ferriss
Google DeepMind News
Google DeepMind News
Hacker News - Newest:
Hacker News - Newest: "LLM"
H
Hacker News: Front Page
博客园 - 司徒正美
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
B
Blog
Microsoft Azure Blog
Microsoft Azure Blog
大猫的无限游戏
大猫的无限游戏
Security Latest
Security Latest
Engineering at Meta
Engineering at Meta
N
News and Events Feed by Topic
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
酷 壳 – CoolShell
酷 壳 – CoolShell
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
T
Threat Research - Cisco Blogs
U
Unit 42
V
V2EX
V2EX - 技术
V2EX - 技术
L
LINUX DO - 最新话题
aimingoo的专栏
aimingoo的专栏
Microsoft Security Blog
Microsoft Security Blog
Recorded Future
Recorded Future
P
Privacy & Cybersecurity Law Blog
美团技术团队
小众软件
小众软件
F
Fortinet All Blogs

博客园 - iMath

宜阅手机通用墨水屏 DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿 - iMath 实时(Qwen-Omni-Realtime) 同好网:基于兴趣标签和地理距离的社交平台 英酷词典添加文档翻译的方法 英酷词典添加AI翻译的方法 AI模型API网址添加到Open WebUI的方法 单词故事 项目简介 Gemini OpenAI Clande等大模型API统一中转URL 国内可用 【视频讲座】用极限计算瞬时速度的原理 【视频讲座】用极限或定积分求出来的面积是准确值还是近似值? 芝诺二分悖论与无穷大是否可被超越? 我的淘宝店 美团门票度假商家新订单短信微信邮件提醒 辅导高等数学、微积分、数学分析 Anki点击翻译 哪里不会点哪里 How many points are inside the hole revealed by the Dedekind cut? 免费版和付费版乐影音下载器的区别 付费版音视频下载插件 购买须知 初探极限符号表示形式之优劣 教材小错误:极限四则运算法则里的除法前提 扩写了华为手机闹钟里的《Star》铃音 为什么圆的面积的导数等于周长?球的的体积的导数等于其表面积? sin震荡函数的图像分析
基于OpenVINO创建文本生成AI服务器
iMath · 2025-12-13 · via 博客园 - iMath
  1. 首先根据官方文档里的这条命令下载

    curl -L https://github.com/openvinotoolkit/model_server/releases/download/v2025.3/ovms_windows_python_on.zip -o ovms.zip
    tar -xf ovms.zip

  2. 运行这条命令 .\ovms\setupvars.bat

  3. 运行这条命令启动模型服务

    ovms.exe --source_model OpenVINO/Qwen3-0.6B-fp16-ov --model_repository_path models --rest_port 8000 --task text_generation --target_device GPU --cache_size 2
    首次运行的话会下载指定的模型,时间可能需要有点长,等待下载完之后下次运行的时候就会自动使用了。如果你要使用别的模型的话,你就更改里面的OpenVINO/Qwen3-0.6B-fp16-ov这个部分就可以;如果要以CPU或NPU模式运行的话,就把里面的GPU换掉就好。

  4. 测试模型是否可以成功使用的话可以使用如下这条命令,注意端口和模型名称要和你的对应

    curl -s http://localhost:8000/v3/chat/completions
    -H "Content-Type: application/json"
    -d '{
    "model": "OpenVINO/Qwen3-0.6B-fp16-ov",
    "temperature": 0,
    "stream": false,
    "messages": [
    { "role": "system", "content": "You are a helpful assistant. /no_think" },
    { "role": "user", "content": "What are the 3 main tourist attractions in Paris" }
    ]
    }'

posted @ 2025-12-13 16:12  iMath  阅读(50)  评论()    收藏  举报