第0050期•2019.09.20 發行
ISSN 2077-8813

首頁 >產業專欄

企業採用人工智慧的三大實際考量

作者: 本文轉載「CIO IT經理人」雜誌 2019年9月號 NO.99 Page88-89

若要成功運用AI,企業需在實際層面上考量其是否具備可解釋性(Explainable AI)、低數據密度環境,以及對更豐富的知識圖譜(Knowledge graph)的需求。

企業對於人工智慧(AI)的採用率正在穩健上升。科技研究與顧問公司 Constellation Research 針對許多行業的CXO進行調查,70%的受訪者表示他們的組織目前使用某種形式的人工智慧科技。此外,大多數受訪者表示計劃在2018年針對人工智慧投資高達500萬美元。

隨著越來越多的公司意識到人工智慧將帶來的大好機會並擁抱這項先進科技,我們可以透過一些實際考量來看待它對整個企業的重大影響。根據我們在眾多客戶環境中應用AI的經驗,我們發現組織必須解決的三個因素:AI是否具備可解釋性、低數據密度環境,以及對更豐富的知識圖譜的需求。為了正確採用和實施AI,企業必須首先考慮這些實際考量因素,並在實施的過程中始終將這三點放在第一位。

1.具備可解釋性
AI的可解釋性旨在回答:「為什麼?」也就是機器做了特定決策的原因。目前,許多新版本的AI已經出現了「黑盒子」概念。大量資訊輸入黑盒子中,接著,AI產出了決策或推薦。然而,當人們試圖打開盒子並弄清楚其邏輯,這就成了難題。這對受監管的市場來說是個問題,因為企業必須揭露並解釋具體決策背後的推理過程。此外,缺乏可解釋的AI可能會影響整個公司所需的變更管理,使AI難以實施。如果無法將答案回溯至某個原始資料集或文件,那麼員工可能難以接受這個價值主張。

實施具有可追溯性的AI是解決這個挑戰的方法。例如,商業銀行管理線上投資產品組合的風險。銀行可以向5,000家中小型企業提供貸款,並以貸款組合中的資產負債表監控企業健康狀況。這些表格可能使用不同的語言或具有不同的會計標準。

有了AI,銀行可以使用所有這些資產負債表,提取資訊,將非結構化資料轉換為結構化資料,然後產生風險評分。銀行可以點擊該風險評分,並深入研究來查看使風險提升的次組件數字(Subcomponent number)。或許,有一個分數看起來不太正確。使用者便可以深入至下一級詳細資訊,以此類推,直到找到不正確的數字。例如:他們可以回溯至第16頁的第36個資產負債表,該頁的註釋將說明AI系統是如何獲得分數的資訊。使用者可以查看決策,並將其解壓縮至元件資訊,而該元件資訊便是驅使機器獲得最終風險分數的原因。可追溯性有助於合法性並增加AI的運用。

2.低數據密度環境
AI能夠善用大量數據,例如虛擬助手,如Siri可以查看電子郵件、線上購物資料和多個應用程式。這就是在企業對消費者(B2C)環境中最先出現許多AI應用程式的原因,在此環境中,演算法可以運算數百萬個數據點。企業通常無法取得相同的數據量。舉例來說,如果一家企業準備使用AI提取過去的合約資訊,可能處理的是十萬份合同,而非一百萬或一千萬份。因此,企業面臨著雙重挑戰:他們需要手動處理的文件太多,而能夠訓練演算法的文件太少。從這些文檔中提取數據的一種方法是使用傳統的自然語言處理演算法,該演算法使用的是統計法。此外,我們發現計算語言學可以在最少量數據的挑戰下有效地解析具有脈絡的含義並擷取數據。

在另一個例子中,財富管理公司可以使用自然語言處理和機器學習等科技來高速匯總金融機構和投資者的發言。公司可以使用80,000個文件檔案,每個檔案長度為50到60頁,每頁有40到50筆交易,並從該語言中擷取知識。這是一個相當大的數據量,若是以手動處理將非常繁瑣,但是對於許多主流AI應用程式來說,這只是一小筆的數據量。

因此,重要的是要注意並非所有AI都是相同的。在尋找最佳AI解決方案時,非常重要的是先了解數據環境。在高數據密度環境中,組織可以更有效地運行無監督學習(unsupervised learning)。在低數據密度環境中,監督學習是最有效的。在所有必要數據都無法取得的情況下,合成資料創建(synthetic data creation)科技可以協助企業培訓模型。例如,在零售業中,公司可以使用模擬遊戲來創造合成資料。

3.需要更豐富的知識圖譜
AI在低數據密度環境中努力產生最佳結果,與此相似,目前也缺乏豐富的「知識圖譜」(knowledge graphs)來使其運用於特定領域和企業應用程式。

知識圖譜這樣的語意網路能捕捉脈絡和關係,可訓練AI資料模型,並分類資訊來源,歸檔於正確的脈絡中。它們使Alexa或Siri等語音助手能夠回答常見問題,例如「最近的星巴克在哪裡?」Alexa和Siri可以透過連接數百萬個參考點(包括亞馬遜或Apple服務的搜尋結果)為用戶提供即時答案。雖然對於這些簡單的互動很有用,但是當前的本體(Ontology)仍然無法複製或理解真實人類對話的複雜性並達到消費者期望的深度互動。

例如,如果一個五歲的孩子向母親抱怨,「Ben在學校推我。我摔倒了,爬起來,然後推回去。老師看到我推Ben,但沒有看到Ben推我,所以我被留校察看了,而他沒有。這不公平。」每個五歲的孩子都能理解這句話,但AI系統仍不理解其中的因果關係和公平性。除了知識圖譜之外,AI系統還需要對話界面來完成思考。

許多企業透過聊天機器人,使用對話式AI來嘗試為客戶提供更具互動性的體驗。銀行一直處於這領域的最前線,使客戶能夠透過線上入口網站或行動應用程式中的聊天機器人獲取基本帳戶資訊。但是,更複雜的請求,例如貸款申請或合約審查,對於機器來說可能是一項挑戰。機器人需要能夠考量到用字的本體、問題的語境以及將多句對話組織在一起。它需要領域(domain)、情境化、方向性(orientation)和知識,使過程更加完整與有機。許多企業正在積極開發特定領域的本體,並將它們嵌入到正確的知識管理系統中,這樣他們就可以在商業環境中推動更具吸引力的AI體驗和應用。

隨著愈來愈多的人工智慧投資和實施,企業必須考慮以下三個實際因素:首先,解鎖黑匣子,追蹤機器的決策,並以可解釋的方式呈現出來。其次,知道如何在缺乏大量資訊的環境中應用AI。最後,嵌入領域知識和經驗學習,以豐富AI的知識圖譜並推動更有效率的AI應用程式。

全文轉載內容(PDF)