在线中文AV精品人人草视频|日韩特黄AA片av超碰|国模免费在线视频|国产高清无码三级片|小毛片小电影人人上人人操|春色av无码黄片无码区|很爽很爽的香蕉视频|日本伊人小视频|亚洲AV网站免费|四月婷婷精品视频在线

AI時代,為什么要做好數(shù)據(jù)治理?

撰文 | 李信馬

題圖 | AI生圖

在AI時代,數(shù)據(jù)已然成為關(guān)鍵生產(chǎn)要素,企業(yè)想充分發(fā)揮AI的潛力,數(shù)據(jù)治理是繞不開的核心環(huán)節(jié)。

不久前,亞馬遜云科技在北京召開的媒體溝通會上,圍繞著如何助力企業(yè)數(shù)智化轉(zhuǎn)型升級,亞馬遜云科技成長型企業(yè)及新興業(yè)務(wù)總經(jīng)理倪殿令進行了分享,尤其是有關(guān)數(shù)據(jù)治理,已經(jīng)成為企業(yè)數(shù)智化轉(zhuǎn)型升級的關(guān)鍵支撐,數(shù)據(jù)引擎和治理也是亞馬遜云科技在AI時代的核心優(yōu)勢之一。

拍攝:DoNews

他用了一個餐館的比喻,餐館有后廚,后廚每天要去采購食材,農(nóng)場把菜運回來后,需要把這些食材進行處理。亞馬遜云科技的Amazon EMR服務(wù),原理就像把倉庫里所有的菜洗干凈、按歸類放好,切成適合炒菜的原材料。

“向量”就像采購回來的菜,把它洗凈、切片,如果要炒土豆絲,就切成土豆絲;如果是炒番茄,就洗干凈切成番茄塊。

這些處理好的食材存放在冰箱里,是按照類別存放的,冰箱就是支持向量存儲的,我們稱之為向量數(shù)據(jù)庫,如Amazon Aurora、Amazon RDS和Amazon OpenSearch。

深度學習的應(yīng)用,就像客人點菜——一個查詢(Query)來了。廚師把冰箱門打開,把菜品拿出來,再炒制后送出去,這就是AI應(yīng)用查詢的邏輯。

“所以大家理解,最重要的不是前端的模型,也不是前端AI的App來查詢,最重要的是底層的數(shù)據(jù)處理能力,以及向量數(shù)據(jù)如何存儲、DBMS數(shù)據(jù)如何歸類存儲的能力。在生成式AI應(yīng)用中,這部分的影響力超過90%。一家企業(yè)能否用好生成式AI,其使用的開源模型或微調(diào)(fine-tuning)模型的‘幻覺’程度,取決于企業(yè)數(shù)據(jù)量的大小和數(shù)據(jù)的質(zhì)量?!蹦叩盍钫f道。

下面的這張圖講的是AI應(yīng)用企業(yè)領(lǐng)域數(shù)據(jù)實施模式,可以進一步看到,數(shù)據(jù)為企業(yè)帶來的競爭優(yōu)勢。

拍攝:DoNews

先看右邊,最底層是大模型,然后掛上RAG(Retrieval-Augmented Generation)增強檢索。有時候外掛的效率很低,需要做微調(diào)。還是用比喻的方法來解釋,一個人從小幼兒園到大學,就像是模型訓練的過程,需要很長的時間去訓練思維模式。

畢業(yè)后到企業(yè)工作,企業(yè)進行上崗培訓,讓你了解行業(yè)知識,這就是微調(diào)(Fine-tuning)。

剛上崗的時候,老板給你指定一位老師,他在試用期6個月的時間里用最快的方式把他腦子里的精華告訴你,要怎么做事,這就是蒸餾——在特定的小范圍找到正確答案最快的方式。

再看左邊,將開源的非結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),再經(jīng)過Amazon EMR的數(shù)據(jù)治理,變成向量存儲,再用于調(diào)用,跟大模型結(jié)合。但對絕大多數(shù)企業(yè)來說,模型用的是開源或者買的,這終究是“別人的”,數(shù)據(jù)才是關(guān)乎企業(yè)能否用好深度學習真正重要的東西。

倪殿令和客戶交流時,對企業(yè)的管理者提出,可以通過“黃金三角”——場景、數(shù)據(jù)、人才——擁抱生成式AI。

首先,場景方面,企業(yè)需要找到既能創(chuàng)造價值,又適合用生成式AI解決的具體業(yè)務(wù)場景,比如智能客服、知識庫構(gòu)建、文生圖或文生文等,但針對業(yè)務(wù)的場景需清晰界定輸入、輸出及預期效果。

其次,數(shù)據(jù)方面,為模型選擇和模型適配的正確的工具,以及建設(shè)良好的數(shù)據(jù)基礎(chǔ)。“把底層的數(shù)據(jù)處理,包括結(jié)構(gòu)化的數(shù)據(jù)基礎(chǔ)夯實好,然后再通過跟大模型之間的調(diào)用關(guān)系把它動起來用好?!?/p>

最后,在整個數(shù)據(jù)治理的過程當中,要有相應(yīng)的人才,比如數(shù)據(jù)工程師、算法工程師,有人做模型適配,有人做調(diào)優(yōu)。

不難看出,數(shù)據(jù)治理被置于企業(yè)數(shù)智化轉(zhuǎn)型升級核心支柱的位置,當然,強調(diào)選擇“正確的工具”,多少也有云廠商“王婆賣瓜,自賣自夸”的原因在。不過在IDC發(fā)布的《IDC MarketScape: 中國面向生成式AI的數(shù)據(jù)基礎(chǔ)設(shè)施2025年廠商評估》報告中,亞馬遜云科技位居領(lǐng)導者類別,也佐證了亞馬遜云科技在數(shù)據(jù)治理方面的實力。

在AI時代,數(shù)據(jù)治理發(fā)揮著至關(guān)重要的作用,為生成式AI應(yīng)用提供了堅實的數(shù)據(jù)基礎(chǔ),確保其準確性、穩(wěn)定性與可迭代性。隨著企業(yè)落地AI應(yīng)用的需求日益增長,可以預見,數(shù)據(jù)治理領(lǐng)域的技術(shù)創(chuàng)新也將不斷出現(xiàn),助力產(chǎn)業(yè)界通過AI創(chuàng)造更多的價值。

注:文中圖片來自現(xiàn)場拍攝(有修正)及AI制作

標簽: AI
AI時代,為什么要做好數(shù)據(jù)治理?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1