決定係数:概要
決定係数とは何ですか?
決定係数は、1つの違いがどのように異なるかを調べる統計的測定値です。 変数は、与えられた結果を予測するときに、2番目の変数の違いによって説明できます イベント。 言い換えると、この係数は、より一般的にはR-squared(またはR2)、2つの変数間の線形関係がどれほど強いかを評価し、傾向分析を行う際に研究者によって大きく依存されます。 その適用例を引用すると、この係数は次の質問を想定している可能性があります。 特定の日に妊娠している場合、彼女が特定の日に赤ちゃんを出産する可能性はどのくらいですか? 将来? このシナリオでは、このメトリックは、受胎と出産という2つの関連するイベント間の相関関係を計算することを目的としています。
1:58
決定係数
重要なポイント
- 決定係数は、データのモデルの統計分析を中心とした複雑なアイデアです。
- 決定係数は、ある要因が別の要因との関係によってどの程度の変動を引き起こす可能性があるかを説明するために使用されます。
- この係数は一般にR-squared(またはR2)、「適合度」と呼ばれることもあります。
- この測定値は0.0から1.0の間の値として表されます。ここで、1.0の値は完全に適合していることを示し、したがって非常に高い値です。 将来の予測のための信頼できるモデルですが、値0.0は、モデルがでデータを正確にモデル化できないことを示します。 全て。
決定係数を理解する
決定係数は、ある要因の変動が別の関連する要因との関係によって引き起こされる可能性があることを説明するために使用される測定値です。 この相関関係は、「適合度、 "は0.0から1.0の間の値として表されます。値1.0は完全に適合していることを示し、したがって信頼性が高くなります。 将来の予測のためのモデル。0.0の値は、計算がでデータを正確にモデル化できないことを示します。 全て。 ただし、たとえば0.20の値は、従属変数の20%が独立変数によって予測されることを示しています。 一方、値0.50は、従属変数の50%が独立変数によって予測されることを示します。 前方へ。
決定係数のグラフ化
グラフでは、適合度は、近似線と、ダイアグラム全体に散在するすべてのデータポイントとの間の距離を測定します。 タイトなデータセットには、 回帰 ポイントに近く、フィット度が高い線。つまり、線とデータの間の距離が小さくなります。 良いフィット感はRを持っていますが
2 1.0に近い場合、この数値だけでは、データポイントまたは予測にバイアスがかかっているかどうかを判断できません。 また、決定係数の値が本質的に良いか悪いかをアナリストに伝えません。 この相関関係の意味と、将来の傾向分析のコンテキストでどのように適用できるかを評価するのは、ユーザーの裁量です。