ICC訊 亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務,支持企業將自定義大語言模型與企業數據相連接,使其 AI 應用能夠提供高度準確的響應。
NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務,通過企業級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。
作為一項語義檢索微服務,NeMo Retriever 借助經 NVIDIA 優化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發者,可以將其 AI 應用與位于各個云和數據中心的業務數據相連通。該服務為 AI 代工添加了 NVIDIA 優化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。
NVIDIA 創始人兼首席執行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業的下一個殺手級應用。借助 NVIDIA NeMo Retriever,開發者可以創建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業的業務數據,通過準確且有價值的生成式 AI 智能來提高生產力?!?
全球頭部企業借助 NeMo Retriever 提高大語言模型(LLM)準確性
電子系統設計領導廠商 Cadence 為超大規模計算、5G 通信、汽車、移動、航空航天、消費和醫療市場的企業提供服務。該公司正與 NVIDIA 合作,為工業電子設計領域的生成式 AI 應用開發 RAG 功能。
Cadence 總裁兼首席執行官 Anirudh Devgan 表示:“生成式 AI 引入了創新方法來滿足客戶需求,比如能在設計流程早期發現潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關性,以便發現問題,并幫助客戶更快地將優質產品推向市場?!?
破解精確的生成式 AI 應用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業可行性的模型、API 穩定性、安全補丁和企業級支持,來為生產就緒型生成式 AI 賦能。
經 NVIDIA 優化的算法使 Retriever 的嵌入模型能夠產出準確性最高的結果。經過優化的嵌入模型能夠捕捉單詞之間的關系,使 LLM 能夠處理和分析文本數據。
企業可以使用 NeMo Retriever 將 LLM 連接到多個數據源和知識庫,這樣用戶就可以輕松地與數據交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅動的應用,企業可以使用戶安全地訪問多種數據格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業能夠以更少的訓練獲得更準確的結果,加快產品上市時間,并減少生成式 AI 應用開發產生的能耗。
通過 NVIDIA AI Enterprise 實現可靠、簡單且安全的部署
企業可以在幾乎任何數據中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。
供應情況
開發者可以注冊并搶先體驗 NVIDIA NeMo Retriever。
關于NVIDIA
自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計算領域的先驅。NVIDIA 1999 年發明的 GPU 驅動了 PC 游戲市場的增長,并重新定義了現代計算機圖形,開啟了現代 AI 時代,正在推動跨市場的工業數字化。NVIDIA 現在是一家全棧計算公司,其數據中心規模的解決方案正在重塑整個行業。更多信息,請訪問 https://nvidianews.nvidia.com/。