• <input id="mmiwo"><label id="mmiwo"></label></input>
  • <code id="mmiwo"><label id="mmiwo"></label></code>
  • 安防峰會
    您正在使用IE低版瀏覽器,為了您的雷鋒網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    人工智能 正文
    發私信給黃善清
    發送

    0

    不讓「數據孤島」成為 AI 發展的絆腳石,「聯邦學習」將成突破口?

    本文作者:黃善清 編輯:汪思穎 2019-02-27 17:39
    導語:如何實現「共同富裕」目標?

    雷鋒網(公眾號:雷鋒網) AI 科技評論按:人工智能經過漫長發展,近些年成功突破技術與算力上的限制,因此得以在新世紀發揮著舉足輕重的作用。不過隨之而來是一系列的新問題——最典型的比如「數據孤島」問題。該問題一日不被解決,將可能抑制人工智能領域的長期發展,并造成嚴重的商業后果。

    人工智能面臨的問題

    人工智能發展至這一階段,存在三個與數據緊密相關的問題:

    1. 很多領域的數據數量有限且質量較差,有人做過估算,如果將醫療數據交由第三方公司標注,需要動用 1 萬人花上 10 年的時間才能收集到有效數據;

    2. 由于競爭關系、安全問題、審批流程等因素,數據之間的流通存在著難以打破的壁壘,即所謂的「數據孤島」問題;

    3. 即便行業間有意交換數據,也可能遭遇政策問責,因為重視數據隱私和安全已經成為世界性的趨勢,如歐盟最近引入的新法案——《通用數據保護條例》(General Data Protection Regulation, GDPR) 就是一個最佳證明。

    針對以上問題,谷歌公司率先提出了基于個人終端設備的「橫向聯邦學習」(Horizontal Federated Learning)算法框架,而 AAAI Fellow 楊強教授與微眾銀行隨后提出了基于「聯邦學習」的系統性的通用解決方案,可以解決個人 (to C) 和公司間 (to B) 聯合建模的問題。

    「聯邦學習」

    「聯邦學習」實際上是一種加密的分布式機器學習技術,參與各方可以在不披露底層數據和底層數據的加密(混淆)形態的前提下共建模型。它可以實現各個企業的自有數據不出本地,而是通過加密機制下的參數交換方式,即在不違反數據隱私法規情況下,建立一個虛擬的共有模型。由于數據本身不移動,因此也不會涉及隱私泄露和數據合規問題。建好的模型將在各自的區域僅為本地的目標服務。在這樣一個機制下,參與各方的身份和地位相同,成功實現了「共同富裕」的目標。

    「聯邦學習」具有四大顯著優勢。

    • 第一是數據隔離,數據不會泄露到外部,滿足用戶隱私保護和數據安全的需求;

    • 第二是能夠保證模型質量無損,不會出現負遷移,保證聯邦模型比割裂的獨立模型效果好;

    • 第三則是參與者地位對等,能夠實現公平合作;

    • 最后,則是能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數的加密交換,并同時獲得成長。

    (更多聯邦學習技術介紹請登陸官網: https://www.fedai.org/#/

    「聯邦學習」規范化

    為了加速「聯邦學習」的普及與落地,楊強教授與微眾銀行做出了眾多努力,其中包括了在國際頂會上發表演講、發布《聯邦學習白皮書 V1.0》以及發布商用級開源項目 FATE(Federated AI Technology Enabler)等。最近,由微眾銀行主辦的 IEEE P3652.1(聯邦學習基礎架構與應用)標準工作組第一次會議在深圳成功召開,會議的召開也正式宣告「聯邦學習」走入行業規范。

    「IEEE 標準協會」是世界領先的行業標準制定機構,其標準制定內容涵蓋互聯網、人工智能、電子電路和通信等多個領域。目前,IEEE 標準協會已經制定了 900 多個現行工業標準,如眾所周知的 IEEE 802?有線與無線的網絡通信標準和 IEEE 1394?標準,同時,還有 400 多項標準正在制定過程中。由微眾銀行牽頭的 IEEE P3652.1 項目是首個聯邦學習領域的國際標準。

    不讓「數據孤島」成為 AI 發展的絆腳石,「聯邦學習」將成突破口?

    IEEE 會議上,楊強教授發表了相關演講

    不讓「數據孤島」成為 AI 發展的絆腳石,「聯邦學習」將成突破口?

    由微眾銀行主辦的 IEEE P3652.1(聯邦學習基礎架構與應用)標準工作組第一次會議在深圳成功召開

    「聯邦學習」未來展望

    在學界與業界的不懈努力下,「聯邦學習」技術日漸成熟,針對不同數據方所涉及數據集的用戶群體和用戶特征不完全相同的問題,如今已延展出橫向聯邦學習、縱向聯邦學習以及聯邦遷移學習等分類:

    • 橫向聯邦學習——在兩個數據集的用戶特征重疊較多而用戶重疊較少的情況下,我們把數據集按照橫向 (即用戶維度) 切分,并取出雙方用戶特征相同而用戶不完全相同的那部分數據進行訓練。

    • 縱向聯邦學習——在兩個數據集的用戶重疊較多而用戶特征重疊較少的情況下,我們把數據集按照縱向 (即特征維度) 切分,并取出雙方用戶相同而用戶特征不完全相同的那部分數據進行訓練。目前,邏輯回歸模型,樹型結構模型和神經網絡模型等眾多機 器學習模型已經逐漸被證實能夠建立在這個聯邦體系上。

    • 聯邦遷移學習——在兩個數據集的用戶與用戶特征重疊都較少的情況下,我們不對數據進行切分,而可以 利用遷移學習來克服數據或標簽不足的情況。

    不讓「數據孤島」成為 AI 發展的絆腳石,「聯邦學習」將成突破口?

    主要基于數據集的用戶群體與用戶特征進行分類,進而決定處理方案

    以借貸行業為例,當需檢測多方借貸的不良用戶時,(在一個金融機構借貸后還錢給另一個借貸機構),在聯邦學習的條件下,即可利用聯邦機制向聯邦內的其他機構發出新用戶的查詢,這樣既能保護已有用戶在各個金融機構的隱私和數據完整性,也能完成查詢多頭借貸的問題。

    我們期待,在不遠的將來,聯邦學習能夠幫助打破各領域、各行業的數據壁壘,在保護數據隱私和安全的前提下形成一個數據與知識共享的共同體,并同時解決了獎勵對聯盟做出貢獻機構的共識機制,將人工智能帶來的紅利落實到社會的各個角落。

    雷鋒網 AI 科技評論 雷鋒網

    雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    文章點評:

    表情
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    11选5下期推算方法