そのデータのインパクトは無限大!

データはたくさんあるのに論文にする時間がない! 

世界中のすべての学者は、出来る限り多くの論文を、可能な限り素早く、最高のジャーナルで出版したいのではないでしょうか。果たして、それを望まない学者がいるでしょうか?研究者は日々、研究成果を発表すると言う、究極のプレッシャーにさらされています。しかし、時には執筆に至らないだけで、研究データは既にあり、そのような時、あなたは「ライターズブロック」に直面しているのです。

ここでは、研究者としてよく見かける状況として、多くのデータを収集(またはデータにアクセス)したが、どのような種類のクエスチョンを評価、執筆し、出版したらよいか分からないという事態を検証し、さらに、データを論文にする方法を説明します。

もちろん、研究がこのように行われることは想定されておらず、逆です。あなたは最初にクエスチョン-仮説-を作成し、次にデータを収集して、それぞれ検証を論駁するものです。しかし、多忙な研究者は、よくデータに囲まれてしまい、次にすべきことが分からないのです。未発表のデータを論文にすることはできますか?多くの場合の答えは「イエス」です。ここでは、実行可能ないくつかの手順の概要を説明します。

たくさんのデータを収集したが、どんな種類か分からない

忙しい研究者は、先に多くのデータを収集したり、アクセスしたりする傾向があります。しかし多くの場合、論文を書いたり、ジャーナルを選択して投稿するなど、困難なプロセス全体を通じて作業を進める時間がありません。多くの場合、データは、研究者たちが論文執筆を計画、解析および作成するよりもはるかに速い速度で蓄積されます。

多くの場合、一歩下がって考えてみると良いでしょう。どのような種類のデータを収集していますか?測定、数値またはカウントを解析するための最良の方法は何でしょうか?最も基本的なレベルでは、どのような種類のデータがありますか?それらは、定量的または定性的のいずれかの可能性があります。

1番目のグループである定量的データは、数値や物事のカウントで提示する傾向にあります。多くの場合、測定値を使用した独自の数値で一連のデータが生成されますが、定性的データは、通常、調査、インタビューもしくは観察に基づき収集されます。最初のカテゴリである定量的データでは、既に収集したデータは離散的ですか、それとも連続的ですか?それにより、提示方法や必要な分析の種類は異なります。

数値と物事のカウント(例:特定エリア内のスポットや動物の数)は、離散データで、他の形式の定量的測定データ(速度、高さ、地域など)よりも簡単に管理や解析が出来る事が良くあります。これらの種類を、情報が性別や色、リスト内の位置、文字のグレードや状態どの特性の品質を説明するかの定性的データと比較してみてください。これらのデータは多くの場合、視覚化と解析が遥かに困難です。

医学研究者は多くの場合、定量的及び定性的両方の種類のデータを収集するか、少なくとも毎日アクセスできるという独自の立場にあります。どの種類のデータを持つか決定したら、次にすべきことは「クエスチョンは何か」です。それらのデータを使い、何を調査できますか?

そのデータは何の調査に使えますか?

全ての分野の研究者が何を調査したいかを慎重に考えず、データ収集のフェーズに突入することが良くあります。ただし、既に大量のデータがあり、追加の論文を執筆する方法を探している場合、あなたはデータ収集の立場にいません。

最初にすべきことは、自分の研究の根底にあるクエスチョンは何かと自問することです。あなたは研究全体で、何を調査しようとしていますか?それはある種の癌による影響を軽減することであったり、新たな治療法を開発することや、小児肥満の問題に取り組んだりすることかもしれません。テーマ別の研究分野においてクエスチョンを絞り込む際は、「ギャップアナリシス」と呼ばれるものを実施し、既存のデータを使用して、さらに有意義な進歩を遂げる事が出来る領域を特定する必要があります。これには通常、現在の文献をレビューして、ナレッジギャップ(明らかなアンメットニーズ)を特定することが含まれます。既存のデータをさらに解析すると、有用な洞察が得られます。

この手順をゆっくり慎重に行うことで、(必要に応じて)より多くのデータを収集し、その後既にアクセスできるデータを分析する準備が整います。言い換えれば、あなたが検証しようとしているクエスチョンは、記述的か、解析的かと言うことです。

1番目のケースでは、特定のパラメーターを収集(または収集予定)し、母集団内の平均収入や最低身長などの特定の項目を評価します。これらは定量的パラメーターですが、クエスチョンはさらに単純です。2つのパラメーター間に描かれた、明確な1対1の傾向線は、通常統計的有意性が評価可能な関係を示すのに十分です。2番目のケースでは、2つの変数間の関係、おそらく平均収入と身長など、より抽象的なパラメーターの評価かもしれません。定量的データですが、通常とは異なる複雑な方法で解析する必要があります。

この段階でさらに解析を実行する方法について疑問がある場合、統計専門家に相談する価値があります。例えば、どの検定が相関関係を示すのに適切であるか、またはどのデータ抽出のアプローチを適用する必要があるか等です。

クエスチョンの作成

収集したデータの種類と、そこから評価に使用できる問題の種類(記述的または解析的)を決定後、明確なクエスチョンを作成します。ここには2つの重要なステップがあります。クエスチョンが興味深い(つまり重要な)ものであり、検証可能であることを確認することです。これはギャップアナリシスから分かります。研究のクエスチョンは、段階的であってはいけません。前の研究にわずかに付け加えただけの小さな前進は、興味深いとは全く言えず、採択される可能性は大きく低下します。

例えば、ある条件下で特定の薬の有効性を評価する最近の研究を見たことがあるかもせれません。このクエスチョンを少し調整し、例えば少し異なるサンプルを使用し、解析を繰り返すだけでは、それほど興味深いとは言えません。対処する価値のある、あなたの研究領域内で大きく前進させるようなクエスチョンを作成するために時間をかけてください。調査のクエスチョンの例は、定量的、定性的、または混合のいずれかです。 

データが既に収集されている場合、効果的な調査のクエスチョンを作成するのに役立ついくつかの指針は次の通りで、これらに注意することが重要です。

  • クエスチョンの作成は継続的なプロセスであり、領域の理解を継続的に更新し、アイデアを洗練する必要があります。特に既にデータがある場合、1つのクエスチョンにとらわれず、柔軟に対応してください。
  • 他の研究者がどのようにクエスチョンを作成しているかを確認し、理解出来るように自分の分野の現在の研究について、常に最新の情報を入手することが非常に重要です。
  • クエスチョンを明確化するため、出来るだけ具体的で簡潔になるように作成しなければいけません。他の人と話すのは良い考えです。あなたの分野の専門家、メンターや同僚を探し、あなたのクエスチョンについて、それは興味深いか、彼らと話をしてみましょう。

データには様々な形と大きさがあります。ここでは、収集した可能性のある主な種類をまとめるようにしました。また、様々なデータの種類を使用し、便利に調査できる、様々な種類のクエスチョンと、入手した情報を使用し、効果的な質問を作成する方法についても検討しました。

多忙な研究者として、あなたは自分の研究で「標準的な」方法で作業することができない場合が良くあるかもしれません。理想的には、クエスチョンを作成し、その問題や仮説に対処するためのデータを収集するための作業を行います。しかし、すでに説明したように、データの山の上にいながら、収集済みの情報をどのように処理するか、途方に暮れる事がよくあるのです。


Gareth J. Dyke PhD
Gareth is a prolific scientific author who has published more than 280 articles in peer-reviewed journals over the last 20 years, including in Nature, Science, Proceedings of the National Academy (USA) and other high-profile outlets.