会計(財務)ビッグデータの可視化とその活用方法の可能性について最新の研究を通してまとめてみました

こんにちは。とむるです。

今回の記事では、『財務ビッグデータの可視化と統計モデリング』(地道他、2018)という面白い会計研究の報告書を見つけたので紹介します。

その内容は、タイトルの通り、会計・財務ビッグデータを可視化し、活用していこうとする新しい試みを行っている会計研究になります。

この報告書では、今までの会計研究ではほぼ見ることのなかった分析フレームワークや分析手法が用いられています

会計ビッグデータを活用した会計研究の可能性

ちなみにビッグデータ化した会計情報を活用する有用性については、2013年にアメリカ会計研究学会がビッグデータに関するセッションを、2014年にはワークショップを開催し研究対象として取り上げました。

ビッグデータ化する会計(財務)情報に着目することでこれまでのデータ内容では得ることのできなかった企業・経営者の行動や財務報告の分析などに新しい知見をもたらすことができると考えられています。

また会計ビッグデータを活用うすることで、会計研究において、より多様な研究内容が生まれる可能性があります。

アメリカ会計研究学会学会が開催したセッションやワークショップの概要については、来栖正利先生が『ビッグ・データと会計問題』という報告書において日本語で紹介されています。報告書はインターネットで公開されています。

報告書・論文の内容

報告書の概要(Abstract)は以下のようになっています。

概要 ビューロー・ヴァン・ダイク(BvD)社のデータベース Osiris から 8 万社を超える 全世界(148 カ国)の上場企業を対象として抽出された 30 年間の売上高, 利益, 資産など の 86 系列の財務指標に関するデータ(財務ビッグデータ)を, GPGPU 環境で Apache Spark+Hadoop と R (RStudio, SparkR, sparklyr)を連動させて利用することによって, 財務 データの構㐀を解明し,企業行動の実態を明らかにする. その際, 探索的データ解析 (Exploratory Data Analysis: EDA) の考えに基づいて時空間の観点から可視化を行い, その 結果として得られた知見に基づき財務データの統計モデリングを行う. さらに BvD 社の データベース Orbis から, 非上場企業を含む 2,000 万社を超える企業の財務指標データ を入手することができた. これは財務データとしては最大規模であり, 企業行動に関す る全く新しい知見が得られることが期待できる.

こちらの報告書は、BvD社のOsirisというデータベースから148か国8万社以上過去30年間における売上高、利益、資産等86系列におよぶ財務指標を利用して行った研究で得られた成果のまとめ内容になります。

さらにこの報告書では、どの程度データを利用したかは定かではありませんが、Osirisの非上場企業を含めて2000万社以上の財務指標データを入手したそうです。これほど大規模な会計データを使った研究は、ほぼ存在しません。

この会計ビッグデータを可視化することでデータの構造を把握しつつ、用いた会計データにおける企業行動を明らかにしようとしています。確かにこうした研究からは、これまでの会計研究では見えなかった新しい知見が得られる可能性がありますね。

以下では、この報告書を自分の勉強がてらその内容をまとめています。何か間違いがあればご指摘お願い致します!

用語解説

まずは、一般的な会計研究の論文ではあまり見ることない単語がたくさん出てきているので、用語解説からします。

ビューロー・ヴァン・ダイク(BvD)社とOsiris・Orbisとは?

ビューロー・ヴァン・ダイク(BvD)社は、世界最大手の信用調査会社になります。グローバルで約2億社の、上場・未上場企業を含めて約3億件以上の企業情報や財務情報を保有しています。

OsirisはそのBvD社の企業情報や財務情報が収録されたデータベースになります。Orbisも同様に企業・財務データのデータベースになります(ちなみにOrbisがBvD社の一番主力の製品になります)

報告書では、Osirisから世界148カ国、約83,000社の上場・上場廃止企業の30年間、86系列の財務指標のデータセットを抽出したものをDS-Osiris、Orbisから非上場企業を含んだ2000万社の連結・単体決算の10年間、83系列のデータセットを抽出したものをDS-Orbisとしています。

GPGPUとは?

GPGPU(General Purpose Graphics Processing Unit)とは、本来画像処理の用途に使われてきたGPUの演算性能を、画像処理目的以外の用途のために汎用的に活用する概念・技術のことになります。

報告書では、データを処理、高速な計算を実現するために用いられています。

Apache Spark、Hadoopって?

Apache Saprkとは、いわゆる今回の研究内容で扱うようなビッグデータに対し、高速に分散処理を行うことができるオープンソースフレームワークのことです。

Hadoopも同じく分散処理フレームワークになります。Apache SparkとHadoopをどのように使い分けているかは報告書の中にはありませんが、Sparkは、Hadoopの処理を補う形で活用しているように思われます。

Hadoopは、同じ処理を複数行うたびにストレージのアクセスが発生しますが、Sparkではメモリ上で処理を行うことができます。

SparkはHadoopよりも高速かつ大規模なデータを扱うことのできる分散処理エンジンだといえます。

さらにApache Sparkについて知りたい方は、Apache Sparkとは何か――使い方や基礎知識を徹底解説のサイトが、Hadoopについては、分散処理技術「Hadoop」とはが参考になります。

さらに今回の研究では、Spark と R を、SparkR を連携させて使用しているようです。

探索的データ解析とは?

探索的データ解析 (Exploratory Data Analysis: EDA)とは、まずデータに触れてみて、データの示唆する情報を多面的にとらえるデータ解析における一番最初のフェーズになります。

データに触れるとは、例えばデータを可視化してみたり、データをパターン性を見つけたり、相関を見つけたりすることを指します。

研究の内容

報告書では、上記で紹介したデータセットを利用して行った4つの研究の概要が述べられています。

1.企業の租税回避研究

現在、パナマ文書やパラダイス文書などで企業や個人の租税回避が問題になっていますが、 Saka et al. (2017)は、会計ビッグデータを使ってこの問題を研究テーマとして取り扱っています。

租税回避は短期的には企業の業績を高めても, 長期的にはステー クホルダーからの信頼を失い, 企業のサステ ナビリティを阻害するという仮説」(地道他、2018、p.3)を立てて、検証を行っています。

検証結果としては(1)企業の租税回避は世界のほとんどの国でみられる、(2) 租税回避の水準は企業間で異なることを確認、(3) )租税回避は企業のサステナビリティを 阻害することを明らかにしています。この論文は、現在公開されているので以下から見ることができます。

また類似の内容の論文として、Saka et al. (2018)があります。こちらの論文では、企業の実効税率の低下と世界各国の法定税率の引き下げ競争によって過去20年間にわたって世界規模で企業・国の税率が下がってきたことを示唆しています。

2.付加価値分配に見る企業の共有価値創造

Oshika et al. (2017)では、100年以上存続する企業においては、株主よりも従業員などのステークホルダーへの付加価値分配率が高いことを示して、サステイナビリティの要因を示唆する論文となっています。

3.企業財務データの可視化と格差の研究

Saka and Jimichi (2017)では、DS-Orbisと統計ソフトRのパッケージを使って、国や企業間における格差のメカニズムや証拠を可視情報とともに示しています。

4.財務データの構造の解明に関する研究

これらの研究の詳細は正直私はよくわかりませんでしたが・・・。統計モデリングを用いた会計ビッグデータ解析を一連の研究では行っています。

以上、会計(財務)ビッグデータの可視化とその活用方法の可能性について報告書や論文を通じて最新の研究フレームワーク、手法を紹介してきました。

今後さらに会計ビッグデータを使った研究が普及し、今までになかった知見が得られるようになっていくと思います。

私、とむるも随時キャッチアップしていきますので今後ともよろしくお願い致します。

参考文献

・来栖正利(2015)「ビッグ・データと会計問題」『流通科学大学論集-経営・流通編-』,27.2, pp.237-246.

・地道正行 (2017)「R を利用した対数非対称 分布族にもとづく財務データの統計モデリ ング」『経済学論究』,71. 2, pp. 141- 174

・阪智香 (2018)「会計ビッグデータの可視化」『企業会計』 70.4 , 中央経済社, pp. 4-5.

・地道正行, 豊原法彦(2018年)「景気先行指数の動的文 書生成にもとづく再現可能研究」, 豊原法彦 編著「関西経済の構造分析」『中央経済社』第 5 章, pp. 77-111

・Saka, C., Oshika, T. and Jimichi, M. (2017) “DoesTax Avoidance Diminish Sustainability?”, SSRN.

・Saka, C., Oshika, T. and Jimichi, M. (2018), “Visualization of World-Scale Evidence on Tax Avoidance and Tax Rate Convergence”, SSRN.

・Oshika, T. and Saka, C. (2017) “Sustainability KPIs for Integrated Reporting”, Social Responsibility Journal, Vol. 13, No. 3. pp. 625- 642.

・Saka, C. and Jimichi, M. (2017) “Evidence of Inequality from Accounting Data Visualisation”, Taiwan Accounting Review, Vol. 13, No. 2, pp. 193-234.

・Jimichi, M., Miyamoto, D., Saka, C. and Nagata, S. (2017) “Visualization and Statistical Modeling of Financial Big Data”, Joint Meeting of 10th Asian Regional Section of the International Association for Statistical Computing and the NZ Statistical Association.

・Jimichi, M., Miyamoto, D., Saka, C. and Nagata, S. (2018) “Visualization and Statistical Modeling of Financial Big Data: Log-Linear Modeling with Skew Error”.

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください