使用 llamafile 运行 InternLM#
llamafile 是一个将大语言模型分发为单个可执行文件的解决方案。
下载 InternLM llamafile#
您可以从发布页面下载预构建的 InternLM llamafile。
运行模型#
下载完成后,直接运行可执行文件:
./internlm3-8b-instruct.llamafile
访问 Web 界面#
模型启动后,在浏览器中访问 http://localhost:8080 来使用 Web 界面与模型交互。
命令行选项#
# 指定端口
./internlm3-8b-instruct.llamafile --port 8081
# 指定主机
./internlm3-8b-instruct.llamafile --host 0.0.0.0
# 查看所有选项
./internlm3-8b-instruct.llamafile --help
优势#
单文件分发,无需复杂的依赖管理
跨平台兼容性
内置 Web 界面
易于部署和分享