Kameno external storage

由無し事をたまに綴るブログです。

研究ノートWiki化のススメ

研究作業の記録に欠かせない研究ノートの書き方が、今ほど話題になったことはないでしょう。しかし、紙のノートに記録を付けるのが研究者として当然のように報道され、CMS (Contents Management System) *1を利用した研究ノートについての言及がほとんど無いのが不思議です。私は5年ほど前から紙のノートに記録するのを止め、WikiとBlogを研究ノートとして使うようにしました。*2
前勤務先の研究室ではMacOSX Serverを導入していましたが、このWebサーバーにはWikiやBlogの機能があります。Wikiはテーマごとにいくらでも作れるので、ユーザー毎に自分専用のWikiを設立できます。紙の研究ノートに限界を感じ、研究ノート用のWikiを作り使ってみたところ思いのほか便利だったので、全面的にCMSに移行しました。

Wiki化の利点

  1. 記録速度
    • ペンで文字を書くよりキーボードをタイプする方が速いです。スペルチェックもリアルタイムにやってくれます。会議の記録もノートに取りますが、タイプであれば清書作業がほとんど不要。ホワイトボードに書いたものはデジカメで撮影します。
  2. 様々なコンテンツを記録できる
    • デジタルデータはほぼ全てWikiに記録できます。観測データを扱う研究では、データ整約のスクリプト書き(広い意味でのプログラミング)に多くの時間を割きます。書いたスクリプトとその結果は重要な研究資料であり、Wikiはバージョン履歴も含めて記録できます。結果のプロットをPDFで保存したり、観測時の装置や設定を写真で記録するのも重要です。容量がGBを超える生データはさすがにWikiに置くのはまずいので、リンクをWikiに記録します。
  3. 検索が容易で強力
    • キーワードで検索できますし、Wikiのページ毎にタグで紐付けしておけば一網打尽にリストできます。公開用のWikiであればGoogle先生が見つけ出してくれます。
  4. 管理が楽
    • 紙のノートは膨大な量になります。学位論文準備のころは2週間に1冊くらい消費していました。何十冊の単位になると管理が面倒になり、100冊を超えると保管場所に困るようになります。その点、Wikiであればサーバーの容量を十分に確保すれば管理に困ることはまずありません。私はWikiサーバーの管理者でもあったので一般ユーザーより管理に初期設定とユーザー管理の手間および障害対策が加わりますが、それでも紙のノート管理より楽に感じます。引越の際にも紙のノートの重さから解放されます。
  5. 研究室外からもアクセスできる
    • 出張先で研究ノートの内容を参照したり、出張先で研究ノートに記録する歳に、インターネット越しにアクセスできるWikiは強力です。
  6. 共同研究者と共有できる
    • 研究テーマ毎にWikiを分けておくことで、共同研究の相手とコンテンツを共有できます。データやスクリプトの共有は共同研究に必須です。
  7. コスト
    • 理化学研究所のラボノートは1冊875円もするそうです。私は紙のノートを使っていたころはコクヨのA4サイズB罫(ノ-201B)を使っていましたが(A4サイズであることはプリンター出力を貼るために重要)、300円以上します。ノート30冊分の値段で、1 TBのハードディスクを買っておつりがきます。

Wiki化の弱点と対策

  • 記録喪失のリスク
    • 電磁記録媒体はかならず壊れると考えた方がいいです。バックアップをとるしか対策はありません。MacOSX ServerのバックアップはTime MachineとCCC (Carbon Copy Cloner) で二重にとり、障害時の復旧速度と信頼性の両方を確立しています。また、大事なコンテンツは個人的にレンタルサーバーにコピーを取っています。
  • 情報セキュリティ
    • 天文学の研究はオープンにしていても構わない内容がほとんどなので、あまりガチガチにセキュリティを固めてはいません。特許や研究倫理がからむ分野では、必要に応じてセキュリティ対策を講じる必要があるでしょう。セキュリティを強固にするほど使いにくくなる、というトレードオフがあります。
  • 障害対応
    • 停電・故障・盗難・災害が問題。停電に対してはUPS (無停電電源装置、要するにバッテリー)を使い、停電を関知したら自動的にシャットダウンするのが常道です。バッテリーが付いているノートPCをサーバーに使ってもいいでしょう。故障に対しては、バックアップ機を用意してミラーリングによっていつでも代替できるようにするのがいいです。盗難と災害に対しては、機器の損失は仕方ないと考え、重要なデータを異なる場所(レンタルサーバーなど)にコピーしておく対策を講じます。

研究ノートの要点から見たWiki化の是非

  • 改竄の可能性
    • デジタルデータは改竄が容易と思われがちですが、編集履歴が残るWikiで矛盾なく改竄するのは難しいです。もちろん、実際には行なわなかった実験や観測結果を捏造してWikiに記録することは可能ですが、それは紙のノートでも同じこと。むしろ、観測生データやリダクションスクリプトのオリジナルを記録できるWikiの方が、再現性の検証が誰でも容易にできるという点で、紙のノートより優れていると思います。
  • 資料の記録・保存
    • 現代の天文学情報科学の側面が大きく、研究資料はほぼデジタル化されているので、Wikiに記録しやすい分野と言えるでしょう。デジタルデータは劣化しないので保存にも適しています。ただし記憶媒体は劣化したり規格が陳腐化して読めなくなるのが早いですから(MT, FDD, DAT, MOなど、最早読み出すのも面倒です)、複数の媒体で定期的にコピーが必要になる点が面倒です。生命科学や実験化学やフィールドワークなどデジタル化できない資料を扱う分野では、CMSと親和性がよくないかもしれません。しかし紙のノートにSTAP細胞を貼るわけにもいきませんから、研究ノートは目録に留まっているとも言えます。これらの分野でもCMSの利用は広がる余地があるでしょう。
  • 再利用性
    • 記録したスクリプトはそのままコピーして何回でも実行できます。紙のノートに書かれた手順をタイプする必要はありません。
    • 論文に載せる図をそのまま保存しておけます。

まとめ

科学研究の要点は検証可能であることで、研究ノートは検証に必要な記録です。検証に必要な要件を満たしていれば、媒体として紙にこだわる必要はなく、使いやすいものを使えばいいでしょう。紙媒体の整理が苦手な私にとって、管理と捜索のストレスから解放されたWiki化のメリットは大きかったです。この分野の弱点である保存性などが克服され、より使いやすい手法が開発されることを期待します。

*1:Wiki化と題していますが一般にはCMS (Contents Management System) が総称であり、Wikiはその一つに過ぎませんので、「CMS化」がより正しいです。しかしCMSという用語は一般には馴染みが薄いので、CMSで最も有名なWikiをタイトルに使いました。

*2:WikiというとWikipediaを指すとことだと思う人も多いようですが、WikipediaWikiを利用した百科事典のことです。