像ChatGPT玩轉(zhuǎn)Excel數(shù)據(jù)
*.引言
最近ChatGPT的出現(xiàn),把人工智能又帶起了一波浪潮。機器人能否替代人類又成了最近熱門的話題。
今天我們推薦的一個玩法和ChatGPT有點不一樣。我們的課題是“讓用戶可以使用自然語言從Excel查詢到自己想要的數(shù)據(jù)”。
要讓自然語言可以從Excel中查數(shù)據(jù),那我們得做點準備:
需要一個Excel文檔
需要一個自然語言查詢工具(這里我們推薦Smartbi NLA)
*.*.體驗自然語言查詢
老規(guī)矩,先上效果再說其他。
【使用錄屏動畫】
2.Excel說明
我們先準備一個Excel,這個數(shù)據(jù)是模仿一個企業(yè)的合同簽訂表數(shù)據(jù)造的一份隨機數(shù)據(jù),有些數(shù)字可能不大合理。不合理的地方,請自動忽略 ^_^。
2.*.數(shù)據(jù)結(jié)構(gòu)說明
2.*.*合同明細表
2.*.2.銷售表
2.*.3.地區(qū)表
2.*.4.日期維
2.2.表關(guān)系圖
【表關(guān)系圖】
2.3.數(shù)據(jù)示例
【Excel詳情】
3.數(shù)據(jù)導入與建模
數(shù)據(jù)情況介紹完了,我們要用上述的數(shù)據(jù),做一個數(shù)據(jù)模型,下面主要介紹下建模的過程。
3.*.Excel導入
Smartbi中的Excel數(shù)據(jù)導入,非常簡單,按照向?qū)Р僮骶涂梢粤恕?/p>
【Excel數(shù)據(jù)導入】
3.2.建立表關(guān)系
3.2.*.第一個表關(guān)系
數(shù)據(jù)導入完成后,我們先建立第一個表關(guān)系。鼠標放到《銷售表》表上面后,會出現(xiàn)4個小圓圈。選擇一個小圓圈,拖動到《合同表》上面,就會自動彈出表關(guān)系對話框。我們選擇關(guān)聯(lián)字段,然后選擇“一對多”關(guān)系。
【《銷售表》和《合同表》關(guān)系建立】
【完整表關(guān)系】
3.3.指標、維表和事實表處理
3.3.*.生成指標
【雙擊“合同金額”轉(zhuǎn)指標】
3.3.2.處理維度
默認情況下,右側(cè)欄的每一個字段,都會默認生成一個維度。但是有些字段(ID、編碼等)在正常的查詢中我們并不需要,所以建議將不需要的字段隱藏。同時為了讓自然語言能夠更好的識別到用戶語言中的指標和維度,建議在設計模型的時候?qū)⒅笜撕途S度修改成用戶常用的詞語。
【隱藏“合同維表”】
【顯示“合同名稱”】
3.3.3.創(chuàng)建時間維度
【創(chuàng)建時間維度】
【選擇時間層次結(jié)構(gòu)】
【生成的時間層次】
【修改季度名字】
【改名后的時間層次】
3.4.自定義指標
除了合同金額,如果我們還想知道“合同個數(shù)”,我們需要對“合同編碼”做唯一計數(shù)。
【生成“合同個數(shù)”指標】
3.5.模型抽取
最后,我們需要對模型進行抽取,將Excel數(shù)據(jù)加載到高速緩存庫中。
【模型抽取】
【點擊:抽取并建寬表】
3.*.模型驗證
模型做好以后,我們需要驗證下模型是否正確。這里可以使用“自助儀表盤”完成模型的驗證工作。
【新建-交互式儀表盤】
【查詢驗證】
3.7.總結(jié)
以上是創(chuàng)建數(shù)據(jù)模型完整的過程。是不是很簡單,手癢的同學可以先試試了。
Smartbi的數(shù)據(jù)模型建設過程非常簡單,全程就是鼠標拖拽就實現(xiàn)了,除了改名,基本不需要使用鍵盤。更不需要寫SQL語句或者其他程序語言。對用戶的要求大大降低。就算稍微有點高級的--做計算指標,對用戶的要求也只是:了解該指標的計算方法,然后基本也是全程鼠標就可以實現(xiàn)了??傊?,使用Smartbi一切都太方便了!
4.自然語言查詢
4.*.訓練NLA模型
Smartbi自然語言查詢,是在“數(shù)據(jù)模型”之上,再建立了一個知識模型(知識圖譜)。這個知識圖譜,需要有一個簡單的訓練過程。不過Smartbi已經(jīng)把這些工作都包裝好了,我們只需要點一個訓練按鈕就可以實現(xiàn)知識圖譜的訓練了。
【訓練AI圖譜】
【選擇需要參與訓練的維度】
【選擇對話式分析-進入自然語言查詢】
4.2.查詢演示
4.2.*.語義場景自適應
【排名演示場景】
Smartbi的自然語言查詢和同類產(chǎn)品有個不一樣的地方就是,通常的自然語言查詢工具,需要比較完整地說出數(shù)據(jù)庫中的字段名,而Smartbi的自然語言查詢是不需要的,用戶可以按照常規(guī)的說法去說這個詞語。系統(tǒng)會根據(jù)當前的語言場景匹配最合適的字段。
比如上述例子中的“廣州分部合同金額排名前十銷售”,系統(tǒng)會根據(jù)當前的語句自動識別是想要對“銷售姓名”排名還是“銷售分部”排名,在這句話中,系統(tǒng)給出的選擇是使用“銷售姓名”進行排序。
“合同排名”也是同樣的意思。這里就不詳細展開了。
4.2.2.自動生成計算指標
【動態(tài)生成計算指標】
Smartbi自然語言查詢,還有一個顯著特點是可以自動生成一些常用的時間計算指標(不需要預先在模型中做好)。比如:同比、環(huán)比這些。
Smartbi NLA支持的時間計算指標有:
同期比
環(huán)比
同期值
前期值
同期增量
前期增量
年累計
年累同比
季累計
季累同比
月累計
月累同比
占比
4.2.3.綜合分析案例
【分析案例】
這個演示主要是介紹使用自然語言分析出“廣州分部合同金額去年同比下降”的原因。最開始查的是“各分部的合同情況”,然后發(fā)現(xiàn)廣州分部同比下降了37%。
然后繼續(xù)問廣州分部各行業(yè)的情況,只看行業(yè)數(shù)據(jù)看不出問題,我們加上了“同比”和“占比”,發(fā)現(xiàn)“占比”比較大的行業(yè)(零售、教育、旅游)的合同額都大幅下滑,特別是旅游行業(yè)下滑73%。
我們再從月份的角度看,基本看到4月、5月數(shù)據(jù)都下滑比較嚴重,到了下半年跌幅也比較巨大。
通過上述示例發(fā)現(xiàn),在做數(shù)據(jù)分析的時候使用自然語言查詢,要比傳統(tǒng)的拖拉拽方式快速很多,比手寫SQL更是進步了幾代。所以使用自然語言做分析,將會給業(yè)務分析人員,帶來更大的方便性。
??感興趣的朋友可點擊鏈接,立即體驗Smartbi智能問答
02*yin.com/smartbi/vision/test.html