开放数据 世界进一步透明化

财通杂志:智人专栏
4月 2017

若利用大数据将世界进一步透明化,可以是怎么样的呢?我又借用金庸的武侠小说来做个说明。上期我用了最喜爱的《倚天屠龙记》做了一个文字云,今期我用《射雕英雄传》的文字云来表现在内容上的关注点,字词的大小就代表了受关注的程度。如果社会上各种事情事物的数据开放程度如一部小说般一字不漏地让大家阅读,那就可以运用人工智能进行大数据分析看清楚每一刻发生的大小事情和关联性。

《射雕英雄传》是射雕三部曲中的第一部,依背景时间顺序分别是:

  • 《射雕英雄传》(南宋中期)
  • 《神雕侠侣》(南宋末年)
  • 《倚天屠龙记》(元末年)

现时图中的颜色并不代表武功强弱,但现在的技术是已经可做到透过不同颜色表现当中的不同正负面程度的讯息,当然未达至百份百准确,应用在这小说的行文用词手法大概只可做到六成左右准确度,即是大家看待同一剧情得出的自身感受和机器分析的结果大约有六成相近,所以上图的颜色层次暂只可当作为视觉效果好了。

但对于当下一般的字词理解是可做到七至八成准确度,若机器学习在某些范畴做得好的话可做到八至九成准确度。要谨记,人也不可能做到百份百准确,不同人去理解相同事情事物也可有很大分歧。

对我来说,这幅图已令我回味当中不少剧情,大家是否「英雄所见略同」!