Nvidia 扩展了 Chat for RTX (ChatRTX) 的功能,在最新版本中增加了对其他大型语言模型 (LLM) 的支持以及视觉和语音支持。免费的本地聊天机器人在处理用户信息时不需要在线发送数据,从而保持聊天的私密性。
不同的 LLM 针对不同的目的进行了调整——一般聊天、科学论文、论文写作等等。一些 LLM 还接受过严格的培训来审查输出,因此这使得某些 LLM 比其他 LLM 更有用。以前可用的 TensorRT-LLM 模型包括默认的 Mistral 模型以及 Llama 2。Nvidia 已经向一些新 ChatRTX 开放了 Gemma 和 ChatGLM3。
Gemma 是由 Google DeepMind 开发的 LLM,于 2024 年发布,作为 20 亿和 70 亿参数模型发布。这些模型经过高度调整,可以过滤掉敏感的言论、个人信息以及有风险或危险的响应。
ChatGLM3 是由智浦 AI 和清华 KEG 于 2023 年开发的 LLM 作为 60 亿参数模型发布的。中英双语模型旨在成为 OpenAI 的 ChatGPT 的强大开源竞争对手。
Nvidia 已将 OpenAI 的 CLIP 神经网络添加到 ChatRTX 中,以自动识别图像并关联相关文本。例如,如果 CLIP 被馈送到电视主播、广播摄像机和房间内灯光的图像,它会将该图像标记为电视演播室的照片。这使得 ChatRTX 无需手动标记内容即可处理图像。OpenAI 的 Whisper 语音识别系统也被添加到 ChatRTX 中,允许用户向 ChatRTX 说出提示。
想要尝试本地聊天机器人的读者可以在此处下载 Nvidia ChatRTX,只要他们满足以下系统要求即可。本地聊天机器人在配备 Nvidia GeForce RTX 30 或 40 系列显卡的 PC 上运行。还支持具有至少 8 GB VRAM的基于 Ampere 和 Ada 的显卡。
来源:IT时代网
IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。
小何
小何
小何
小何