2009年05月23日
連載:リスク資産の複利確率(19)~シミュレーションのための連続複利年率とリスクの求め方とは?
期待リターンを基に連続複利年率を求め、それが正規分布するようなシミュレーションをしてみたところ、結果として出てきた期待リターンが当初の2倍近い結果になってしまいました。
収益率5%の連続複利年率は4.879%です。これは公式に当てはめて計算すれば分かることなので間違いありません。
(1 + 収益率R) = e連続複利年率r
(1 + 5%) = e4.879%
ところが、この連続複利年率が正規分布に従うというシミュレーションをしてみると、その収益率の平均は5%にはならず、約10%になってしまいました。リスクも33.5%になってしまいました。(参照:連載:リスク資産の複利確率(18)~連続複利年率のリスクの求め方のはずが、どんでん返しに!)
e正規分布(平均4.879%, リスク30%)→ 収益率の平均 10%、リスク 33.5%の対数正規分布
これはどう考えればいいのでしょう?
なによりも前提として、例えば1年後の期待リターンが5%、リスク30%という金融商品があって、それを20年といった長期間保有したらどうなるか、という問題の答えが知りたいわけです。そのためにずっと調べてきています。
世の中には、1年後の期待リターンやリスクが統計的に分かっている金融商品やインデックスというのはいくつもあるわけです。例えば、国内株式や外国株式などのインデックスの期待リターンやリスクは年金積立金管理運用独立行政法人などで入手できます。
そして、これらの期待リターンやリスクは連続複利率として発表されているわけではないので、その値はそのまま正規分布であることを前提として、1年後の期待リターンやリスクの値として受け取るべきだと僕は考えています。
こういう前提に立ち、かつ、シミュレーションの前提としている「金融商品の価格は連続複利年率の収益率が正規分布する」という方法論を重ね合わせると、やはり1年間のシミュレーションをした結果の平均=期待リターン5%、標準偏差=リスク30%になるような連続複利年率が正規分布する、という状態を作り出すシミュレーションにしなければならないと思います。
これを数式のようなもので考えると、次の式を満たす平均μとリスクσを求めなければならないと考えます。
e正規分布(平均μ, 標準偏差σ)→収益率の平均5%(数式的には1+5%)、リスク30%の対数正規分布
eのべき乗の形になっていますから、これでも「連続複利年率の収益率が正規分布する」収益率の金融商品であることは満たしていると考えます。何を基にした連続複利年率なのか? といえばそれは分かりませんけれど。
少なくとも期待リターン5%を基に計算した連続複利率4.879%を平均μとしても上記の式を満たさないのですから、それはこのシミュレーションで使おうとしていた値ではなかったと考えるべきなのでしょう。
では上記を満たす平均μと標準偏差σはどうやって求めればいいのでしょう? 答えは身近なところにありました。すでに僕は、以前の記事「どうやって投資信託の値動きのシミュレーションをしたのか」でこの問いに答えていたのです。
つづく。
この連載のバックナンバー
・ 早くも帰ってきた! 連載:リスク資産の複利確率(1)~ 連載の目的と前提
・ 連載:リスク資産の複利確率(2)~ 参考書に載っている計算式
・ 連載:リスク資産の複利確率(3)~ リターンとリスクのグラフ化
・ 連載:リスク資産の複利確率(4)~ 収益率が正規分布に従うということ
・ 連載:リスク資産の複利確率(5)~ 正規分布なシミュレーションの設計
・ 連載:リスク資産の複利確率(6)~ 正規分布なシミュレーションをExcelで実行
・ 連載:リスク資産の複利確率(7)~ 食い違う計算結果とシミュレーション結果の「謎」
・ 連載:リスク資産の複利確率(8)~ 謎を解くカギは「B方式」にあるらしい
・ 連載:リスク資産の複利確率(9)~収益率の変化をシミュレーションするという
・ 連載:リスク資産の複利確率(10)~どうして収益率を足しているのだろう?
・ 連載:リスク資産の複利確率(11)~連続複利とは? 無限に連続する複利の金利を求める
・ 連載:リスク資産の複利確率(12)~連続複利を計算してみた
・ 連載:リスク資産の複利確率(13)~連続複利の世界では掛け算が足し算になる!
・ 連載:リスク資産の複利確率(14)~ 収益率を連続複利だと想定したシミュレーション
・ 連載:リスク資産の複利確率(15)~ もういちどこの連載の目的を確認する
・ 連載:リスク資産の複利確率(16)~新たな考え方でシミュレーションを作ることにした
・ 連載:リスク資産の複利確率(17)~シミュレーションのために連続複利年率を求める
・ 連載:リスク資産の複利確率(18)~連続複利年率のリスクの求め方のはずが、どんでん返しに!
・ 連載:リスク資産の複利確率(19)~シミュレーションのための連続複利年率とリスクの求め方とは?
・ 連載:リスク資産の複利確率(20)~シミュレーションの作り直し3度目の正直
・ 連載:リスク資産の複利確率(21)~新しいシミュレーションを試してみる
・ 連載:リスク資産の複利確率(22)~最も重要な公式、N年後の確率分布を求める式を記す
・ 連載:リスク資産の複利確率(23)~複利で増える可能性は明らかに半数未満である
・ 連載:リスク資産の複利確率(24)~リスクは結果のバラつきだけでなく、やはり危険度を表している
・ 連載:リスク資産の複利確率(25)~期待リターンに対して、これ以上とってはいけないというリスクの上限がある
・ 連載:リスク資産の複利確率(26)~長期投資で儲かる確率が上昇するかどうかは、リスクの大きさがカギ
・ 連載:リスク資産の複利確率(27)~これが合理的なリスクの取り方ではないのか!
・ 連載:リスク資産の複利確率(28)~最終回「総集編」
[関連カテゴリ]
・ H.リスク資産の複利確率
[広告]
≫次 : 第4回インデックス投資交流会に参加して7時間飲んできました
≪前 : 連載:リスク資産の複利確率(18)~連続複利年率のリスクの求め方のはずが、どんでん返しに!
black (2009/05/31 1:26:52)
水瀬さんのところから飛んできて,初めて読ませていただいております.
複利計算の話は非常に興味深いですね.
ひとつ気になった点があります.
そもそもデータの取り方は合っているのでしょうか?
1年目の母集団から5000点を抽出する下りは良いと思うのですが,問題は2年目以降です.
上記の結果から2年目は5000点の【母集団】ができます.しかし3年目は5000点の【母集団】から【1点づつ】しか抽出してません.以下20年まで同じです.
つまり3年目以降のデータは抽出点数が確率統計を論ずる上で明らかに不足しています.
今回,リターンが理論式と一致するのは,リターンはxバーが対象のため,10%の加重がそのまま付加されるためです.一方で,分散は【偏差平方和】と【データ点数】が対象のため,データ点数が不足する場合は理論と比べてずれが大きくなります.基本的にデータ点数が足りないと分散は大きくなるので,結果と定性的には一致してそうです.
つまり正しい分散を出すためには3年目は5000点×5000点のデータが必要ということです.等比級数的に増加しますね・・・
すいません.口出しするだけで計算はまだやってません・・・
一般的にデータ点数は50点で良いと言われているのでそれぐらいなら・・・
一度ご検討ください.
ちなみに連続複利の下りですが,株価などでは連続複利の収益率をテイラー展開した場合,単年の収益率と一致するため,単年の収益率で良いと言われています.
ファンドの海管理人(イーノ) (2009/05/31 19:07:35)
blackさん、こんにちは。コメントありがとうございます。
発散する方法でシミュレーションしようとすると、たしかにそうなりますね。ただ僕のシミュレーションの方法は別の方法をとっています。
ご指摘の「2年目から5000の母集団ができる」のはたぶん誤解をされていて、最初の0年目から母集団は5000なのです(0年目は値にばらつきがないので一点にみえるだけです)。そして2年目、3年目と計算が進むにつれて“母集団を構成する5000の各点の値にばらつきが発生”します。求めようとしているのは、この各点の平均や分散です。ですから、何年先であっても母集団の構成数は5000で、それゆえこの構成数に依存する精度に関しても何年先でも一定だと思うのですが、いかがでしょうか。
下記の記事をみていただくと(あるいは下記の記事のシートをダウンロードしていただくと)どうやってるか感じをつかんでいただけると思います。
http://www.fund-no-umi.com/blog/2009/02/6-excel-092f.html
またこの方法は、生命保険会社の論文などで「モンテカルロ法」などと呼ばれている方法と同じですので、間違ってないのではと思っています…
black (2009/05/31 21:17:11)
管理人殿返信ありがとうございます.
色々考えてみましたがやはり疑問が消えませんでした.
まず今回の問題は
N年後の平均または標準偏差が計算とシュミレーションで差が出ている.との認識ですが,問題ないでしょうか?
私の考えでは
複利は単利の繰り返し
で算出できると思います.
私の疑問点を書きます.
1年目
1つの母集団からサンプル数5000点を抽出し,uとσ2を算出
⇒この場合自由度は4999となり,uとσ2の値は信頼できると考えられます.この点は管理人殿と同じ見解だと思います.
問題は2年目です.
例えば1年目の結果が元本変化無しの"1.0"だったとします.
管理人殿の計算方法だと,新しい"1.0"という母集団に対して1点しかサンプルしません.これが正しいかどうかです.
私の考えでは,1.0に対して,ばらつきを正しく計算するためには,1年目と同じサンプル数が必要だと考えます.(これが複利が単利の繰り返しと考えてる理由です.)
順序としては,5000点の母集団から5000個の正規分布を作成し,その後5000個の正規分布から平均および標準偏差を計算すると計算式と一致するかなと思います.
ということでやっぱりサンプル数は増えるのではないかと思います.
勉強不足で自信はないですが・・・
ファンドの海管理人(イーノ) (2009/06/01 0:00:13)
blackさんこんばんは。僕もうまく説明できないのと、専門用語を正しく理解している自身がないので、お説の疑問の本質がなになのかが申し訳ないのですがうまく把握できていません。
実は来週公開予定の記事では、今回の式でシミュレーションの結果がほぼ一致しますので、僕的にはほぼ謎が解けている(まだ書いてないですが)。という状態です。なので、それをみていただくと、この考え方で答えが出せるということをを分かっていただけるか、もしかしたら何か別の形で間違いが指摘されてしまうか、という感じなのではと思っています。
Sean. (2009/06/01 12:07:06)
blackさん
> 1年目
> 1つの母集団からサンプル数5000点を抽出し,uとσ2を算出
> 問題は2年目です.
> 管理人殿の計算方法だと,新しい"1.0"という母集団に対して1点しかサンプルしません.これが正しいかどうかです.
イーノさんの方法は次のようになっています。
1系列目:1 x (1+NormInv(Rand(),0.1,0.3)) x (1+NormInv(Rand(),0.1,0.3)) ・・・ ・・・
2系列目:1 x (1+NormInv(Rand(),0.1,0.3)) x (1+NormInv(Rand(),0.1,0.3)) ・・・ ・・・
・
・
5000系列目:1 x (1+NormInv(Rand(),0.1,0.3)) x (1+NormInv(Rand(),0.1,0.3)) ・・・ ・・・
それぞれの系列毎に2年目以降【各年1点を抽出】して、20年目まで掛け合わせてその系列の累積リターンを推定されています。さらに、この系列を5000個作成し、平均と標準偏差を計算されています。ですから、「2年目は5000サンプル抽出しているが、3年目以降それぞれに1サンプル抽出したものを適用している」と捉えられるのは、誤解ではないかと思います。
> ちなみに連続複利の下りですが,株価などでは連続複利の収益率をテイラー展開した場合,単年の収益率と一致するため,単年の収益率で良いと言われています.
興味深い指摘ですね。詳しく教えていただければ幸いです。
イーノさんの問題意識は、「単年の収益率と標準偏差とを累積し複数年後のリターン・リスクを計算すると、拡散してしまってうまくいかない」と言うことだと思います。そこで連続複利で計算されようとしているのですが、『単年の収益率で良い』と言うのは、この問題意識に対して別のアプローチがあると言うことなのでしょうか?
ファンドの海管理人(イーノ) (2009/06/01 14:36:51)
Sean.さん、補足ありがとうございます。正確に説明していただいて感謝です。
テーラー展開とかよく分からないのですが、もし新しい方法があるとすれば、勉強してみたいですね(そんな時間がこれからとれるかどうかですが...)。
black (2009/06/04 0:53:22)
seanさん
説明ありがとうございます.ごめんなさい.まだ理解できません...
1年目がOKなのは,1年目に出た結果が,すべて同じ1つの正規分布(元本1万に対してリターン5%,リスク30%)から抽出した5000点だからです.
2年目がNGなのは,5000個の正規分布があるという点です.1年目の結果が1.1万と0.9万では正規分布の形は同じでも中心が違いますよね?
統計学的にはこの場合別の正規分布と認識します.
確かに正規分布の形が同じなら,同じものと認識していいと感じてしまうと思います.
ただ,標準偏差を考えた場合,別ものと考えないといけません.(1.1万が0.9万になるリスクと0.9万が0.9万になるリスクは別だからです.)
ゆえに別の正規分布だとした場合,1点抽出となり,正しい検定(確かに抽出結果が正規分布と一致している)とは言えません.
> ちなみに連続複利の下りですが,株価などでは連続複利の収益率をテイラー展開した場合,単年の収益率と一致するため,単年の収益率で良いと言われています.
すいません.日本語おかしかったです.
>単年の収益率と[ほぼ]一致します.
に訂正させてください.私が言いたかったのは,細かく連続複利で見なくても結果とあまり差がでないので神経質になる必要がないのではないかということです.
ちなみにテイラー展開の結果は収益率をRとすると
ln(1+R)=ln1+R/1-R^2/2+R^3/3...となります.2乗で打ち切った場合は0.04875となり,まぁ0.05と変わらないんじゃないの?っていう話なんで,わざわざ学ぶ価値はないです(笑)
管理人殿
>実は来週公開予定の記事では、今回の式でシミュレーションの結果がほぼ一致しますので
期待値と分散が対数正規分布の式と一致するので,(なんとなくしか眺めていないので,断言はできませんが)このシミュレーションで出た結果は1年の計算では一致するはずなので間違いないと思います.複数年の場合どうなるか非常に興味があります.期待してます.
Sean. (2009/06/04 11:16:40)
blackさん
> 2年目がNGなのは,5000個の正規分布があるという点です.1年目の結果が1.1万と0.9万では正規分布の形は同じでも中心が違いますよね?統計学的にはこの場合別の正規分布と認識します.
疑問点がよく分からないのですが、推測して答えます。
(1)「1年目の結果が1.1万と0.9万では正規分布の形は同じでも中心が違う」ということについて
前年の結果がどうであっても、収益率(前年比)をとることによって中心をそろえています。
(2)「前年の結果によって分布が変化するのではないか」ということについて
年次毎の確率分布は同じであることを前提としています。これは、データの採り方がそうなっているからです。
すなわち、年次毎の観測データ(株価など)が、[X1,X2,・・・・Xn]であったとき、その収益率である[X2/X1,X3/X2,・・・・Xn/Xn-1]が、『1つの理論分布(正規分布や対数正規分布など)』に従うことを前提にしています。前年の収益率[Xn/Xn-1]の値毎に別の分布を当てはめるようなことはしていません。
したがって、イーノさんは【N(平均μ,標準偏差σ)からランダムに抽出した結果】をn乗することで、n年後のリターンを計算されています。
blackさんのお考えでは、平均値に依存する分布【Nμ(平均μ,標準偏差?)】が複数あって、前年(まで)の結果a1,a2,a3・・・に基づく別々の分布を掛け合わせることになるのでしょうか?
Na1(μ1,?)xNa2(μ2,?)xNa3(μ3,?)x・・・
確かに、株価の長期トレンドなどを見ていると、時系列的な依存性を感じますね。現在のテーマとは別に扱うべきでしょう。
black (2009/06/05 0:45:52)
んー大分こんがらがってきてしまいましたね・・・
問題点を整理させてください.具体例でいきます.
目的:元本1万をリターン10%リスク30%で複数年運用後の結果を予測する.サンプルを5000点とする.
①1年目の結果1.1万と0.9万が発生する(可能性がある).
これは問題ないですよね?
我々の見解の相違がでているのは2年目以降で,
私:1年目の各結果に対してそれぞれ複数点のサンプルが必要.
sean殿,管理人殿:2年目以降は各1サンプルで問題ない.
私が複数点のサンプルが必要だと考える理由は
1年目で得られた結果はそれぞれ異なった正規分布だと考えないといけないという点です.
上記理由を具体例で考えます.
1年目1.1万の場合2年目は中心が1.1×1.1=1.21の標準偏差0.3の正規分布に従うはずです.
1年目0.9万の場合2年目は中心が0.9×1.1=9.9の標準偏差0.3の正規分布に従うはずです.
これが,形は相似形ですが,中心が違うと考える理由です.つまり別の正規分布なのです.
さて,この場合一つの正規分布に対して1点しか抽出していない今回の方法は確率統計学的に正しいのでしょうか?
難しいですね・・・いい勉強になります.
Sean. (2009/06/05 11:28:59)
ピンポンピンポンピンポーン!大正解!
そうなんです。『中心が異なる相似形の分布』なのです。
【平均1.21(=1.1×1.1)、標準偏差0.3の正規分布】と、【平均0.99(=0.9×1.1)、標準偏差0.3の正規分布】とは異なる確率分布です。その通り!パチパチ・・・・
ところで、この2つの分布は相似形なのでシフトしてやれば重なりますよね。
最初の分布から0.11引き、後の分布に0.11加えてみましょう。
【平均(1.21-0.11=)1.1、標準偏差0.3の正規分布】と、【平均(0.99+0.11)=1.1、標準偏差0.3の正規分布】
な・な・な・なんと、どちらも【平均1.1、標準偏差0.3の正規分布】ですね。
このようにすると、全て同じ分布として扱うことが出来ます。いちいちパラメータを変えて計算せずに済みますから便利ですね。
イーノさんのシミュレーションは、このような考え方に基づく処理をして、同じ正規分布からデータを抽出しても差し支えないようになっています。よく読んで考えてみてください。
> 今回の方法は確率統計学的に正しいのでしょうか?
正しいです。
ファンドの海管理人(イーノ) (2009/06/06 14:00:05)
Blackさんsean.さん、いろいろご検討ありがとうございます。お二人の議論は高度で僕は全部を把握し切れていませんが....。sean.さんに正しいと判断していただいてるのは、嬉しいです。さきほど最新記事を公開したので、そちらもどうぞご覧ください。
[トラックバックURL]