Ethereumステーキング:イーサリアムMEVリワードがバリデータ収益に与える影響の考察 ~2023年のリワード分析結果~


目次

  1. はじめに
  2. MEVリワード
    2.(1) MEVとは
    2.(2) MEVの適用状況
  3. MEVリワードの状況
    3.(1) 期待値、中央値、四分位数
    3.(2) 日次集計データ
    3.(3) 個別MEVリワードの分布
  4. 収益性に与える影響
    4.(1) 仮定
    4.(2) バリデータ数の設定
    4.(3) ブロックバリデータの選出確率
    4.(4) MEVリワードの総額
  5. おわりに

Executive Summary
イーサリアムのバリデータ活動で得られる報酬にはコンセンサス・リワード(Consensus Reward)とエグゼキューション・リワード(Execution Reward)があり、後者としてMEVリワードがある。本レポートでは、2023年のMEVリワードの実績データを取得して傾向を分析し、極めて裾の厚い分布であるという結果を得た。そのうえで、バリデータの稼働による収益を、実績で示される期待値に近づけるために必要なバリデータ数を検証し、一般的な100台以下の台数において期待値を実現できる割合はおよそ25%であるとともに、中央値は期待値の50%から85%であるという結果を得た。

Keywords: Ethereum, MEV, MEV-Boost, Flashbots, Execution Reward

1. はじめに

イーサリアムのバリデータ活動を行うことで得られる報酬は、大きく2種類に分けられる。一つは、バリデータがブロックチェーンの確認検証作業を行うことで、運営機関から定期的に受け取る「コンセンサス・リワード(Consensus Reward)」である。そしてもう一つは、バリデータがブロック生成を受け持った時に、そのブロックが含有する取引の執行によって特別な利益を得たものから受け取る「エグゼキューション・リワード(Execution Reward)」である。

本レポートが対象とする「MEVリワード」は、エグゼキューション・リワードの実装枠組みである「MEV-Boost」によって、バリデータが得る報酬のことをいう。レポートでは、まずMEVリワードの傾向を分析し、そのうえでMEVリワードがバリデータの収益性に与える影響を検証する。収益性は、リワードの期待値に対する中央値や四分位数の水準を、シミュレーションを用いて計算し比較する。

本レポートで議論する、バリデータ活動で得られる報酬については、弊社レポート「Ethereumノード運用:ステーキングの仕組みと報酬」([3])も参考にされたい。

2. MEVリワード

2.(1) MEVとは

MEVとは、Maximum Extractable Value(最大抽出可能価値)を略したものであり、特定のブロックにおけるトランザクションの追加、削除、または順序変更により、ブロックの生成時において標準的なブロック報酬やガス代を超過して抽出できる最大の価値のことを意味する。イーサリアムPoSでは、12秒毎に作成されるブロックについて、ブロックの生成者が、稼働中のバリデータの中から無作為抽出で一台指名される。このブロックの生成者は、当該ブロックにどのトランザクションを包含するかにつき全権を保有している。したがって、トランザクションを成立させたい者は、自身が希望するトランザクションが成立した際にはそこから得られる収益の一部を分配することを確約して、自己に有利になるように進めようとする。以上の概念がMEVであり、現在の枠組みのことをMEV-Boostという。

MEVの詳細は、イーサリアム公式ホームページの[1]もしくは和文ページの[2]を参照されたい。また、MEV-Boostについては、弊社レポート「Ethereumバリデーター:取引手数料を最大化するMEV-Boost」([4])も参考にされたい。

2.(2) MEVの適用状況

現在のイーサリアムPoSにおいて、ブロック生成がMEV-Boostを経由する割合は非常に高い。下図 1.は、ブロック生成においてMEV-Boostを経由した割合の推移を示している。図から2022年9月のThe Merge以降MEV-Boostの割合は即座に上昇し、2023年を通して6割から8割強を維持していることが読み取れる。2023年につき、数字上は合計で2,042千個、割合でいうと77%に相当するブロックにMEV-Boostが適用されている※1。

図1. ブロック生成に占めるMEV-Boost経由の割合

図1.png
出所:Flashbotsで取得したデータをNext Finance Techにて加工※2

ここで図1.には、次章以降で分析に使用するflashbotsを経由した割合も表示した※3。

※1:イーサリアムPoSは12秒に一度ブロックを生成するので、一日には7,200個(=60 x 60 x 24 / 12秒)、一年間では2,628千個(=7,200 x 365)のブロックが生成される。
※2:Flashbotsデータソース: https://boost-relay.flashbots.net/
※3:図中のデータは2022年10月に一部欠落がある。

3. MEVリワードの状況

本章では、MEVリワードの状況について、まず日次で集計したデータを示し、そのうえで個別ブロックでのリワードデータの2段階に分けて分析を行う。

3.(1) 期待値、中央値、四分位数

定量データの分析を実施するにあたり、統計データにおける期待値(平均)と中央値および四分位数について簡単に説明する。

はじめに「期待値」とは平均のことであり、文字通り、観測されたMEVリワードの合計を観測データ数で除したものである。期待値が、統計量の中でも最も基本的なものであることに異を唱える人は少ないと考えるが、期待値の実現性については注意が必要である。つまり、対象とするデータの歪みが小さいときは、50%に近い確率で期待値を実現することができる。しかしながらデータの歪みが大きいときは、期待値を実現することが難しくなることが知られている。このようなデータにおいては、期待値よりも中央値の方が、より有用な統計量になることがある。

他方「中央値」とは、データを小さい順に並べたときに、順序が真ん中(50%)にあたるデータのことを言う。別にわかりやすい表現をすれば、中央値は確率50%で実現できる数値である。また同様に、小さい方か25%の場所にあるデータを第1四分位数、75%の場所にあるデータを第3四分位数という。データの状況が左右対称であれば、中央値は期待値に一致する。逆に収入分布のようにデータが右側(上側)に広がるときには、中央値は期待値よりも小さくなる。

本レポートでは、MEVリワードでの収益の状況を対象にしていることから、期待値だけでなく中央値および四分位数に焦点をあてて分析を実施する。

3.(2) 日次集計データ

はじめに、MEVリワードを日次で集計した金額(以下、「日次MEVリワード」という)を対象に分析を行う。対象とするデータは、2022年9月15日のThe Merge以降、2023年12月末までの全てのデータである。前述のMEV-Boostの仕組みの説明から、イーサリアムPoSには一日あたり7,200ブロックが存在し、そのうち図 1.に示す割合のブロックがMEV-Boost経由であることから、日次MEVリワードは、それぞれおよそ数千件のMEVリワードの集計額となっている。以下に、日次MEVリワードの時系列推移、度数分布、および基本統計量を順に示す。

図2. 日次MEVリワードの推移(単位:ETH)

図2.png
出所:Flashbotsで取得データをNext Finance Techにて加工

図3. 日次MEVリワードの度数分布表

図3.png
出所:Flashbotsで取得データをNext Finance Techにて加工

表1. 日次MEVリワードの基本統計量および四分位数

スクリーンショット 2024-02-16 173819.png

一見してわかるのは、非常に大きなリワードが計上された日が複数ある、ということである。具体的に、日次MEVリワードがETH 2,000を超える日は8回観測され、2022年11月8,9,10,12日、2023年3月11日、5月5,6日、7月30日である※4。これにより、度数分布は右に裾の厚いグラフとなっている。特に最大値はETH 5,720であり、平均からの距離は11.1標準偏差(=(5,720-719)/449)であることから、特異値と呼んでもよい値であろう。

※4:2022年11月は、FTXの経営問題に関連する市場の混乱により、MEVの機会が多数発生したと推察する。また2023年7月30日は、弊社レポート「AAVE:取引状況と金利履歴の考察」([5])で分析を実施した、AAVEの大口清算取引に付随するものと推察され、参考にされたい。

3.(3) 個別MEVリワードの分布

3.(3).a データの概要

続いて、個々のMEVリワードの状況を分析する。ここで、MEVを経由したブロックの生成は2023年の一年間で2百万件を超えて発生しており※5、全てを直接対象にすることは、データの取得負荷が大きい。そこで、MEV-Boostの中でもシェアの高いFlashbotsのデータを、今回の分析の対象とする。

この点、2023年にFlashbotsを経由したブロック生成の件数は861,598件であり、MEV-Boostの総数2,042千個の42%に相当することから、Flashbotsの観測データから得られる経験分布は、MEV-Boostの分布に類似すると考えられるであろう。ただし、FlashbotsのMEV-Boostにおけるシェアは時期によって異なることから、今回の分析では、リワードの発生時期の情報は分析の要素に含めず、金額のみを対象にする。

3.(3).b 集計結果

下図 4.が個別リワードの度数分布であり、表 2.がその基本統計量と四分位数である。ここで、個別MEVリワードの観測データは、裾の厚いロングテールをしており、そのまま度数分布で図示することは困難なため、対数変換した値の度数分布を作成した。

図4. 個別MEVリワードの度数分布表(対数変換あり、単位:千件)

図4.png
出所:Flashbotsで取得したデータをNext Finance Techにて加工

表2. 個別MEVリワードの基本統計量および四分位数

スクリーンショット 2024-02-16 173834.png

度数分布表に示す対数を見るにおいては、下表 3.の対数変換表も参考にされたい。

表3. 対数変換表

スクリーンショット 2024-02-16 173845.png

※5:およそ2,042千件のブロックがMEV-Boostの枠組みを使用している。

3.(3).c 考察

個別MEVリワードのデータは、率直に、極めて異質性が高い。データ数は861千件と非常に多く、かつすべてが非負の正値である状況において、平均0.13に対する標準偏差が2.07と非常に大きい。また、最大値の584.06を、平均と標準偏差を用いて測定すると、282標準偏差(=(584.06-0.13)/2.07)であり、標準偏差での測定自体が意味を持たない水準にある。また、平均の0.13は、第3四分位の0.096よりも高い数値であり、さらに細かく調べると、82%点の0.126をも上回る数値である。

この状況を既存金融取引にあてはめて考えると、少なくとも「収益」の分布としては考え難いものである。あるとすれば、オペレーショナルリスクにおける「損失」の分布は、裾の厚いロングテールになることが知られているが、ここまで極端になるかどうかは不明である。

いずれにしても、バリデータの運用者が、最大値で観測されるリワードを実現可能なものと考えることは危険であり、また、平均についても通常期待できる水準と考えることは難しいであろう。それに変えて、中央値(50%値)ならびに他の四分位数を用いて実現可能な水準を検討することが、現実的と考える。

Appendix 1.には観測データのパーセンタイル表を添付するので、併せて参考にされたい。

4. 収益性に与える影響

本章では、MEVリワードがバリデータの収益性に与える影響を、一年間の期待値(期待MEV収益)と中央値および四分位数の水準を比較することで検証する。このときに、保有するバリデータの台数は、1台から100台までで順に計算する。また、期待値は解析的に計算可能であるが、中央値および四分位数はサンプルを必要とすることから、検証にはモンテカルロ・シミュレーションを使用する。

4.(1) 仮定

本章の計算では、次の条件を仮定する。

  1. バリデータの総数と自己保有台数は、一年を通して変わらないとする
  2. ブロック生成バリデータは、都度全体から無作為抽出して選出される
  3. ブロック生成バリデータの選出と各ブロックでのMEVリワードの額は無関係であるとする
  4. 各ブロックでのMEVリワードの額は、一年を通して同一の分布に従うとする

上記のうち一点目は、計算の簡略化のために導入する仮定である。他方二点目は、PoSの枠組みで正規に定められているものであるとともに、各回の試行の独立性を確保するものである。また三点目も、PoSの枠組みで正規に定められているものであり、ブロック生成バリデータに選出される事象とMEVリワードの額の独立性を確保するものである。最後の四点目は、リワードの分布の同一性を確保するとともに、過去の統計データを適用するための設定である。

上記を仮定すると、最終的に得られるリワードの確率分布は、ブロック生成バリデータに選出される確率 X_n と、各回のMEVリワード額の分布確率 Y の組み合わせで表すことができる。

4.(2) バリデータ数の設定

図 5は、2020年12月から2023年12月までの月末時点でのバリデータ数の推移と、前月からの変化を示したものである。これによると過去三年間にバリデータ数は漸増しており、2023年12月末時点でのバリデータ数は900千台、直近一年間における1月あたりの増加数は、月による変化はあるが、およそ34千台である※6。

この増加数を基にすると、2024年の一年間の平均的なバリデータ数は、1,100千台(≒900千台+34千台×6)と考えると良いだろう。

図5. バリデータ数の推移(単位:千台)

図5.png
出所:beaconcha.inのデータをNext Finance Techにて加工

※6:2022年12月末時点でのバリデータ数は493千台であり、34千台=(900千台 - 493千台)/12とした。

4.(3) ブロックバリデータの選出確率

バリデータ総数をNN台、自己で保有するバリデータ数をnn台、一年間のブロック数をMM個とすると、自身がブロック生成にkk回選出される確率P(X=k)P(X=k)は仮定2.から、各回の当選確率がpnp_nで試行回数がMM回の、二項分布で表すことができる。

P(X=k)=((Mk))pnk(1pn)Mk,pn=nN P(X=k)=( \begin{pmatrix} M \\ k \end{pmatrix})・p_n^k(1-p_n)^{M-k},p_n=\frac{n}{N}

上記の式でNNに1,000千台とMMに2,628千回(=60秒×60分×24時間×356日/12秒)を適用すると、保有バリデータ数nn台に対する、期待値(期待選出回数)、中央値、および四分位数が計算できる。その結果を表4.にまとめる。

表4. ブロックバリデータ選出回数の試算

スクリーンショット 2024-02-16 173858.png
出所:Next Finance Techにて作成

ここで、期待選出回数は二項分布の平均の計算式である M⋅p_n を用いて解析的に計算し、中央値および四分位数は、二項分布の逆関数で数値的に算出している※7。

※7:Pythonにおける‘scipy.stats’モジュール’binom’クラスの’ppf()’関数や、Excelの’binom.inv()’関数等

4.(4) MEVリワードの総額

最後に、MEVリワードの総額を計算する。

まず、確率変数YYを各回のMEVリワードが従う分布とすると、一年間に受け取るMEVリワードの総額ZZi、i番目のブロックで自身が受け取るリワードの額ZiZ_iを用いて、

Z=i=1MZi Z = \displaystyle \sum_{i=1}^M Z_i

と表すことができる。ただし、

Zi={Y,確率pn0,確率1pn Z_i = \left\{ \begin{array}{ll} Y, & 確率p_n\\ 0, & 確率1 - p_n \end{array} \right.

である。このとき Z の期待値(期待MEV収益)は、次の式で分解することができ、かつ最後に現れる EY は、表 2.の観測データでは0.13であることから、単純な乗算のみで解析的に計算できる。

EZ=E(i=1MZi)=i=1MEZi=MEZ=MpnEY EZ = E(\displaystyle \sum_{i=1}^M Z_i) = \displaystyle \sum_{i=1}^M EZ_i = M・EZ_* = M・p_n・EY

これに対してZZの中央値および四分位数は、解析的に求めることはできず、モンテカルロ・シミュレーションでの数値計算を実施する。具体的には、次の3ステップを1セットとして1年間のMEVの合計のサンプルを作成し、これを複数回実施して得られる統計量を、分析対象にするものである。

Step 1: 一年間にブロックに選出される回数を、乱数に基づいて決定する
Step 2: Step 1の回数個のMEVリワードの金額を、前者と異なる乱数に基づいて決定する
Step 3: Step 2のMEVリワードを合計し、1サンプルとする

下表 5.は、上記のセットを10万回実施して得た統計量である。

表5. MEVリワードの試算(単位:ETH)

スクリーンショット 2024-02-16 173914.png
出所:Next Finance Techにて作成

表 5.について、「期待MEV収益」は解析的に計算した期待値であり、「平均」はシミュレーションを用いて数値的に計算した平均である。この差は、シミュレーションの収束性を表している。厳密なシミュレーションにおいては、平均の期待値への収束性を基準にシミュレーション回数を決定するのであるが、今回は、概数を確認することが目的であることから、計算回数を10万回と確定的に実施している。そのもとで、およそ小数点以下第二位で差異が発生しているということを認識しておきたい。

そのうえで、収益性の点で着目するのは、「中央値」(確率50%で実現する数)および「第3四分位」(同25%で実現する数)である。中央値は、バリデータ数が十分に多いときは、中心極限定理によって期待値に収斂することが理論的に示せる。逆に、現実的なバリデータ数においては、右に裾のあるリワードの分布形状から、中央値は期待値よりも低くなる。

この点、実際に計算を行うと、通常想定すると見込まれる水準よりも、期待値からの乖離が大きくなることがわかり、具体的には、5台では期待値の65%、10台では71%、50台では82%である(表 6)。このことから、特にバリデータを小規模で運営する場合には、MEVリワードを小さく見積もる必要があるだろう。

表6. 期待値と中央値の比較

スクリーンショット 2024-02-16 173937.png

他方、第3四分位数は、偶然にも、どのバリデータ数においても期待値とほぼ同水準になった。すなわち、25%の確率では期待値相当の収益が見込める、別の表現をすると、4年に一度くらいの確率では、期待値相当の収益が見込めるということである。

5. おわりに

本レポートでは、MEVリワードの状況の分析と、それが収益性に与える影響の検証を実施した。

MEVリワードについて言えることは、何よりも裾の厚いロングテールの分布ということである。これによって、期待値と実際に実現するリワードには大きな差が出ることが、直感的に理解できる。それを具体的に検証したところ、50%の確率で得られる収益は、バリデータが5台の時には期待値の65%に過ぎず10台でも71%と、一般に見込む水準に比べても低いものであった。一方で、25%の確率で得られる収益は、ほぼ期待値と同水準であり、悲観的なものになる必要はないであろう。

最後に、大きなMEVの発生は、市場イベントに起因する大口取引の発生に依拠することが多く、予測可能なものではない。例えば今回は、2023年の実績を基礎として計算を行ったが、実際に今後1年間に発生するMEVリワードの額は未知数である。この点からも、今回の分析の内容は、あくまで期待値の実現性に焦点を当てていることを理解することが重要である。

参考文献

[1] Ethereum.org. “MAXIMAL EXTRACTABLE VALUE (MEV)“. Ethereum Development Documentation. N/A. https://ethereum.org/en/developers/docs/mev , (参照2024-01-28)
[2] Ehereum.org. “最大抽出可能価値(MEV)”. イーサリアム開発ドキュメント. N/A
https://ethereum.org/ja/developers/docs/mev , (参照2024-01-28)
[3] Next Finance Tech. “Ethereumノード運用:ステーキングの仕組みと報酬”. Ledefiリサーチ事業部. 2023-09-14
[4] Next Finance Tech. “Ethereumバリデーター:取引手数料を最大化するMEV-Boost”. Ledefiリサーチ事業部. 2023-06-11
[5] Next Finance Tech. “AAVE:取引状況と金利履歴の考察”. Ledefiリサーチ事業部. 2023-11-09

Appendix 1. 個別MEVリワードのパーセンタイル表

表7. 個別MEVリワードのパーセンタイル表(N=861,598)

スクリーンショット 2024-02-16 173953.png
出所:Next Finance Techにて作成