我所專注的電信系統評估,需要調整多個參數,往往得畫出數百張效能評估圖來找出最佳解答。
最常面臨的問題之一是所謂的「維度詛咒」(Curse of Dimensionality)。當資料的維度(亦即參數)增加後,要找到所有可能參數組合的困難度會迅速倍增至無法處理的地步。維度詛咒的挑戰,正如我們在AI或大數據領域所面臨的困境:當資訊過於龐雜,人類必須尋找方法「降維」,才能以有限的視角理解無窮的世界。
這個問題由發明動態規劃(Dynamic Programming)的理查・貝爾曼(Richard Bellman, 1920~1984)所提出。他的「維度詛咒」警告,提醒我們在多維度情境下計算與搜尋的困境。後續並沒有單一數學家「解決」這個問題,而是透過一系列方法來部分緩解,例如降維(Dimension Reduction)、主成分分析(PCA)、隨機投影等。
在眾多相關學者之中,戴爾可尼司(Persi Diaconis;1945年生)的故事特別引人入勝。
他出生於音樂世家,曾在世界著名的茱麗亞學院(The Juilliard School)研修小提琴近9年。14歲時,他遇到美國魔術大師維農(Dai Vernon, 1894~1992),覺得魔術比拉小提琴更有趣,於是逃家跟隨維農各處巡迴表演。16歲時,他獨立行走江湖賣藝。
24歲時,他深感魔術技巧進入瓶頸,應該尋求一些理論基礎,以提升他的表演。因此,他在書店找到一本機率的入門書《Introduction to Probability Theory and Its Applications, Vol. I》,由斐勒(William Feller, 1906~1970)所寫。結果發現難以理解,於是決定進大學學習機率。最終,他成為史丹佛大學統計系的Mary V. Sunseri講座教授。戴爾可尼司並沒有「解決」維度詛咒,但他的研究在隨機性、馬可夫鏈與高維幾何方面提供降維與分析的啟發,對相關領域影響深遠。
當維度降到2或3時,結果就能以統計圖表呈現。常用的統計圖表包括圓餅圖(Pie Chart)、曲線圖(Line Graph)和條狀圖(Bar Graph)。
許多人以為圓餅圖是由南丁格爾(Florence Nightingale, 1820~1910)所創,事實上,最早的圓餅圖是由英國工程師暨政治經濟學家普萊菲(William Playfair, 1759~1823)所發明。他曾擔任發明蒸氣機的瓦特(James Watt)的助理,幫忙繪製工程圖,也參與不少發明。他在1801年的著作《統計學摘要》(Statistical Breviary)中首次使用圓餅圖,顯示土耳其帝國在亞歐非三洲所佔的面積。
南丁格爾的貢獻則在於善用圖表來推動改革。她在克里米亞戰爭中觀察到病死的士兵遠多於戰死者,但僅靠數字報告難以引起重視。於是她創造了一種玫瑰圖(Coxcomb diagram),這是一種與圓餅圖相似的放射狀圖表,用以強調護理改革的成效。她的圖表設計雖然被部分統計學家批評「不易精確比較」,但在當時確實發揮巨大說服力,讓英軍投入更多資源改善醫療條件,拯救無數生命。
相較於圓餅圖,條狀圖在大部分情境下表達訊息更好。條狀圖同樣是由普萊菲所發明,他常說「文不如表,表不如圖」: 這句話也是我寫論文時所奉行的準則。
在愛丁堡有一條樓梯小徑紀念普萊菲。他的名字也取得很妙。我常說:「Playfair used graphs and charts to play fair」。