2009年07月11日

キレました。(その1)

去年の夏のお話です。

この夏こそはたまっている論文を書き上げるぞぅ手(グー)、と気合を入れていたところに、当時首を突っ込んでいたとある研究のPIである職場の同僚(L先輩)が、「この論文夏中に書き上げて投稿したいから、みんなで役割分担しよう」と言ってきたんです。
そう言われると“他人に迷惑をかけるな”が骨身に沁み込んでいるニッポンジンのあたしは、自分の論文を後回しにしてふらふら、んじゃ、データ集めたのあたし(&その学生)だし、メソッドはこのあたくしめが書きましょう、と引き受けました。
メソッドを書くのは比較的得意なので、まあ1−2日もあればサクサクっと書けるでしょ、とその時は思ったんです。

んじゃまあ、サンプルの特徴を調べますか、とデータセットを開けたところでジーパンデカ(わかるひと〜?)登場。


なんじゃごりゃぁぁぁあ!


ひ、ひどいっ、あまりに酷すぎるデータセットの有様でした。
データ分析担当のもう一人の同僚(S先輩)がデータベースをセットアップしたところに、学生がデータ入力したんですが、そのS先輩ときたらデータ収集に関して皆で相談して決めたことを全く無視して(たぶんそんな事などは忘却の彼方に追いやられてしまっていたものと思われます)データベースをセットアップしたらしく、何も知らない(わからない?)学生が言われるがままに入力したデータは“*#$@?%”な状態。

こ、これって、もしかして、データベース一から作り直さなきゃならないんぢゃ・・・がく〜(落胆した顔)

途方に暮れながら、データ元とデータセットの数字を一つ一つ比べてみると、データ入力した学生ちゃんてばさすがあたしが選り抜いた“あたしの”学生ちゃんだけあって、データそのものは一応系統だてて入力してあるぢゃないのキスマーク
これなら、データ入力までやり直さなくて済みそう、とほっと胸をなで下ろしたものの、このデータセットをお掃除するという予定外の作業に何日も費やすハメになったのは言うまでもありませんダッシュ(走り出すさま)

やっとデータセットのお掃除が終わって、んじゃサンプルの平均年齢とか年収とか人種別とかグループごとに調べますか、と作業を進めていたんですが、ここであたしのおせっかい虫登場目
というか、データセットがめちゃくちゃだったわけだから、S先輩が前にやった統計の分析はチャラにして分析しなおさないとダメじゃないですか、とL先輩に言ったら、「今S先生つかまらないから、もしできるんならやってくれない?」と。
できるんなら、というか、S先輩がやった分析って、統計分析と言えるほどのこともないごく基本的なことなので、それくらいならお安い御用です、と引き受けたところまではよかったんです。

ここで、おせっかい虫に加えて好奇心虫まで登場猫
このS先輩がやった基本計算分析、S先輩は「このデータじゃこれくらいの分析しかできないよ」と言ってたけど、こんな程度のモンだったら投稿してもダメなんぢゃ?と密かに思っていたあたし。
でも、S先輩は一応うちのプログラムで“統計の専門の人”ということになっているので、それまでは余計なことは言わないでいたんですが、こうしてデータセットを目の前にしたら、もう黙って見過ごすわけにはいけません。
もっとちゃんとした統計処理法が使えるはず耳と、そこから何冊もの統計本やらインターネットやらと首っ引きの日々が数日続き、分析結果を表やらグラフやらにまとめてL先輩とS先輩にメールで「こんなん出ましたけどー」と送りました。
ここまでの経過をよく知っているL先輩は「あっぱれ、でかしたかわいい」とばかりに喜んでくれたんですが、問題はS先輩。

「この統計処理は別の場合に使うものなんだ。僕はこの統計処理についてはキミが生まれる前の19xx年に論文を出したことがあるんだよ。でも、未だにこの統計処理をつかってくれる人がいるのは嬉しいねぇ。」



ぷっつんむかっ(怒り)



そんな音がどこかで聞こえた気がしました。



あたし、その年には生まれてましたけどっちっ(怒った顔)



と、そこからがメール合戦。
いや、あたしはS先輩と統計で戦うつもりはこれっぽっちもなかったんです。その時はS先輩のことをまだ“統計の専門の人”だと思っていたし。
とにかく、あたしの考えのどこが間違ってるのかが知りたくて、コレコレこういう論理でこの統計処理に辿りついたんですが、どこが違うんでしょうか、とそういう旨のメールを送ったんですが、あたしの訊き方が悪かったのか、あたしが使っていた統計用語が適切でなかったのか、S先輩とのメールのやり取りは全くかみ合わず。
あたしがどんなに一生懸命調べて、ちゃんとココにこういう風に書いてあるんですが、と言っても、S先輩は全くちぐはぐな返事してくるし。
てゆーか、コレってあたしテキトーにあしらわれてる?と思われるスジ多々あり。
S先輩曰く、「とにかく今旅行中だから、来週戻ったらちゃんと結果観るよ」と。


そうしてS先輩の帰りを待つ間、L先輩の指示でさらに別の分析もしていた去年の夏。


つづく


人気ブログランキングへ
この記事へのコメント
統計専門の私がいろんな職場で分析をやって発見したこと:「分析に要する時間は共同研究者の人数に比例する」
Posted by Willy at 2009年08月05日 05:50
Willyさんのブログのエントリー読ませていただきました。ひじょーに納得です。共同研究もほんと良し悪しですよね。
Posted by EL at 2009年08月23日 07:06
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
 
Web phd.seesaa.net