toptoppage


R言語とは


「R言語」の中の一部分を下記に載せます。詳しくは「R言語」(ウィキペディア)をお読み下さい。

R言語は文法的には、統計解析部分はAT&Tベル研究所が開発したS言語を参考としており、またデータ処理部分はSchemeの影響を受けている。(S言語は1998年にACM,アメリカの計算機科学分野の学会のソフトウェアシステム賞を獲得した。)

◆持続可能な統計環境
教育課程から実務への移行や職務環境の変化が生じると、利用可能な計算資源というものはあっさり変わってしまう。
R言語の登場以前は、学術論文など社会的信頼性を要求される統計データの処理環境といえば高額なプロプライエタリソフトウェアばかりが前提とされた。だがこれでは継続的な予算がつかなくなれば環境のサポートやアップデートは停止してしまい、極端な話、予算がもとから無い立場に異動してしまうと在来の統計処理が何も出来なくなる事態になりかねない。
統計家にとっては、いままで習得し錬成した手法と蓄積したデータとその運用方法は、たとえ環境が変化しようとも継承できなくては困る。この意味から、他に多く存在するプロプライエタリの、つまり「生かすも殺すも版権保持者の都合次第」というような統計処理ツールと比べ、R言語のようなオープンソースで、それゆえCRANパッケージ等によって日々機能拡張しうる、つまり「フリーソフトウェアの精神に則り永続的で世界規模な集合知に支えられ、無償でありながら高い信頼に値する」統計環境というのは、統計家の長期的な生産性に大きく寄与する「持続可能な統計環境」と言える。

世界中のRユーザーが、作成したパッケージをCRANで公開しており、これらは自由に使用できる。CRANはR資産の知識共有メカニズムとも言え、CRANによってR言語の機能は日々強化されている。R言語本体のみでも機能は潤沢だが、第一線ユーザー達の実務経験が反映した豊富なパッケージ群は大きな助力となりうる。

◆最近の展開
CRANパッケージ数の飛躍的な増大に見られるとおり、統計学を超えて学問分野や業界を問わず、金融工学・時系列分析・機械学習・データマイニング・バイオインフォマティクスなど、柔軟なデータ解析や視覚化そして知識共有の需要に応えうるR言語の普及は世界的な広がりを見せている。

近年、生命科学分野のためのRパッケージプロジェクト『Bioconductor』が立ち上がり、すでに多くのゲノムスケール関連パッケージが配布されている。ゲノムスケールデータの諸情報、すなわち大規模遺伝子発現プロファイル、質量分析データ、タンパク質相互作用データなどを解析するプログラムやデータをRパッケージとしてユーザーに配布する仕組みである。2008年時点で、Bioconductorの日本国内ミラーサイトは統計数理研究所にある。

また現在では、かつてSAS一辺倒だったFDA(アメリカ食品医薬品局)への薬事申請や報告の際にもRが用いられている。RjpWiki / RとFDA(アメリカ食品医薬品局)への薬の申請にかかわる資料

SPSSでは2009年より製品名をPASW Statisticsと改め、R言語との連携強化を発表した。SPSSのインタフェースからRの機能を使える。データ分析のスタンダードツール PASW Statistics 18|SPSS Japan

2009年7月、SAS InstituteはR Interface Coming to SAS/IML StudioによってSASからR言語へのインタフェースを提供することを発表した。公式ページには、新たな統計手法はたいていの場合まっさきにR言語上で実装されるという現状をふまえSASユーザーの要望に応えてインタフェースの提供を行なう、との旨が述べられている。SAS9.2ライセンス保有者ならば、無償でダウンロード可能。SAS Institute Inc. Software Downloads SAS SAS/IML Studio 3.2

◆「R」の使い方等は本研究所ホームページを参照して下さい。
Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved