banner

ブログ

Jun 29, 2023

勾配ブーストデシジョンツリーと加重リスク分析を使用したパイプ故障のリスクの予測

npj クリーン ウォーター 5 巻、記事番号: 22 (2022) この記事を引用

3751 アクセス

2 引用

3 オルトメトリック

メトリクスの詳細

パイプ故障予測モデルは、事前の管理上の意思決定を行うために不可欠です。 この研究の目的は、勾配ブースト ツリー モデルと、局所的な特性を関連付けた 1 km グリッド上のパイプの特定のセグメント化とグループ化を使用して、パイプ破損の確率を返す信頼性の高い予測モデルを確立することです。 このモデルは、約 40,000 km のパイプラインと 14 年間の障害履歴を持つ英国の広範なネットワークに適用されます。 モデルは、受信者オペレーター曲線と曲線下面積 (0.89)、ブライアー スコア (0.007)、およびマシューズ相関係数 (0.27) を使用して精度を評価され、許容可能な予測が示されました。 加重リスク分析を使用してパイプ故障の結果を特定し、意思決定者に高リスクのパイプをグラフィック表示します。 重み付けされたリスク分析は、予測された障害の結果を理解するための重要なステップとなりました。 このモデルは、パイプのメンテナンスや交換の可能性に関する長期的な重要な決定を行う戦略的計画に直接使用できます。

多くの配水ネットワーク (WDN) は老朽化が進み、設計寿命の最終段階にあり、パイプの故障、漏水、水の無駄につながり、環境、経済、社会に影響を与えています。 水需要の増加と気候変動の影響によって圧力が高まり、給水へのストレスが生じ、水道規制当局が性能目標を達成できなかった場合に高額の罰金を課しているため、適切な事前管理を通じてパイプ故障の影響を軽減することが急務となっています。 プロアクティブな管理は、問題を事前に回避し、許容可能なリスクのレベルを設定することを目的とした、WDN 管理の望ましいアプローチです。 従来、プロアクティブな管理は、単純化されたランク尤度モデル、専門家の判断、および詳細なネットワーク知識を使用して、歴史的に定期的に障害が発生していたネットワークの重要な領域を対象として、パイプの交換または修理に優先順位を付けることで実現されます2。 ただし、この単純化されたアプローチは、パイプ故障の複雑なメカニズムを備えた WDN の管理には適しておらず、水の喪失による財産やインフラへの損害、修理中の潜在的な中断、給水の中断、修理と交換の経済的コストなど、複合的な関連リスクが発生します。 プロアクティブな管理には、将来のパイプのパフォーマンスを理解し、潜在的なリスクを評価する必要があります3。

統計的なパイプ故障モデルは、過去のデータとその原因となる要因から故障パターンを識別することで将来のパフォーマンスを予測し、予防的な管理をサポートする手段を提供します4。 Shamir と Howard (1979)5 は、パイプの築年数を使用してパイプ 1000 フィートあたりの年間故障数を予測する単変量時間指数モデルを備えた、小規模なパイプ WDN に関する最初のモデルの 1 つを開発しました。 多くの場合、複数の要因が同時に作用して複雑な故障メカニズムが形成され、結果としてさまざまな故障モードが生じるため、単変量モデルには限界があります。 これらの要因は、パイプ固有、環境、運用に大きく分類できます6。 さらに、静的変数 (パイプと土壌) と動的時間関連変数 (天候) を含む多変量モデルを使用して故障数や故障率を予測することにより、パイプを相互にランク付けするために使用できる 8 という進歩が見られました。 インシデントはまれに発生するため、資産レベルでパイプ故障の数を予測することは数学的に問題があります9。 したがって、故障率に基づく研究は、ネットワーク全体で同様の特性によってパイプ故障をグループ化し、統計的に有意なグループ化されたパイプ長ごとに十分な故障を提供することに焦点を当てています10、11。 ただし、ネットワーク レベルでパイプをグループ化すると、同様の特性を持つすべてのパイプが同様の局所的な条件 (床層の状態、トラフィックの負荷、ローカル ネットワーク ジョブなどの局所的な影響) と障害率を共有すると想定されますが、これはほとんど当てはまりません。

0.9 is outstanding34. Figure 1 shows the ROC curve for the test dataset close to the top left-hand corner and an AUC value of 0.89, suggesting the model has an excellent discriminative ability to distinguish between the classes, and the TPR and FPR appear robust enough to predict failures on the unseen test data./p> {\rm{threshold}}} \end{array}} \right.\). The default probability threshold within the model is 0.536. By this definition, there remains a practical need to optimise the probability threshold specifically to the behaviour of pipe failures within the imbalanced test data. An optimal probability threshold typically strikes a balance between sensitivity and specificity. However, there is a trade-off between TPR and FPR when altering the threshold, where increasing or decreasing the TPR typically results in the same for the FPR and vice versa. Probability threshold optimisation is an important step in the decision-making process and is specific to each problem. In the case of pipe replacement, expert judgement should be used by reasoning that water companies would seek to avoid unnecessarily replacing pipes that may have a longevity of several decades more, resulting in wasted maintenance effort and cost. Furthermore, only 0.5–1% of the network is typically replaced each year due to budget constraints37. It is therefore important to only identify pipes with the highest probability of failure. Considering this, the optimal threshold is set to reduce the FNs (i.e., pipes predicted to fail when they have not). This reduces the number of TPs predicted as discussed above but targets those pipes most likely to fail./p>0.02; ≤0.06] and high [>0.06; ≤0.92]. In this scenario, the length of pipe in the high-risk category is 13.9 km of the 300.7 km or 4.6% of the pipe network present in Fig. 4, a useful percentage of the network to target for management decisions. The choropleth risk map approach is an important means of visualising individual pipes or clusters of pipes with the highest risk in the WDN, evidenced in Fig. 4. Figure 4 also highlights how many pipes in this section of the network have a low risk, which is to be expected since many pipes have a low probability of failure and have small diameters, potentially causing less damage if they fail./p> 200. (iii) second condition for partitioning data by variable x1 at both 30 and 60 to create two more disjoint region R3 and R4 (Taken from Barton et al.55)./p>

共有