SRE NEXT 2022 に Topotal から高村、吉川、坪内が登壇

2022/5/16 00:00
株式会社Topotal (以下、Topotal) から高村 (@nari_ex)吉川 (@rrreeeyyy)、テクノロジアドバイザーの坪内 (@yuuk1t)の3名が SRE NEXT 2022 のスピーカーとして登壇しました。
SRE NEXT 2022 とは
SRE NEXT は信頼性に関するプラクティスに深い関心を持つエンジニアのためのカンファレンスです。同じくコミュニティベースの SRE 勉強会である「SRE Lounge」のメンバーが中心となり運営・開催されています。SRE NEXT 2022 は「SRE DIVERSITY」をテーマとしています。
開催日時
2022年5月14日、15日
登壇概要

How We Foster "Reliability" in Diversity

CEO / SRE
高村 成道
SRE において「信頼性」は最も重要な指標とされています。しかし、一言で「信頼性」といっても、会社の戦略やサービス、文化によって、計測方法や目指す値、その達成方法にいたる全てが同じになることはないでしょう。さらに、一度定義した信頼性が適切であり続けることはなく、会社や組織のフェーズによって、その時々で柔軟に変化していく必要がありそうです。 このように、サービスを取り巻く環境の変化に応じて適切な信頼性を定義し、またその信頼性を「育てて」いく方法として、サービスや組織の戦略と SRE チーム の方向性を揃えたり、SRE チームの垣根を超えて組織全体に SRE の文化を根付かせるための取り組みなどを紹介しながら、多様性とともに SRE がどのように歩んでいくかについてお話します。

SREの歩き方・進め方

CTO / SRE
吉川 竜太
SRE NEXT2022では「SRE DIVERSITY」というテーマの下で、幅広い業種/領域でのSRE Practiceの実践例を集約し、より多様なSREの実践が普及していくきっかけの提供を目的にしています。 一方で、本セッションではSREのPracticeやそもそものSREの概念に対して、これから理解を深めていく方を対象に、SRE自体の説明やSLI/SLOなどのPracticeに関する説明を交えつつ、SREのPracticeを導入する上での考慮点についてSpeakerとのQ&A方式でお話します。SREに対する理解を深めて、「SRE DIVERSITY」に飛び込むことができる、SRE Next2022のコンテンツがより楽しめるような内容となっています。

AIOps研究録―SREのためのシステム障害の自動原因診断

テクノロジアドバイザー
坪内 佑樹
コンテナ型仮想化やマイクロサービスアーキテクチャなどの採用により、クラウド上に展開されるアプリケーションが複雑化しています。オペレーターが複雑なシステムの状態変化を観測可能とするために、システムからメトリクス、ログ、トレース、イベントなどに代表される様々な運用データが常時収集されます。システムが複雑化するほどに、運用データの量が増加するため、システム障害の予防・予測・検知・原因診断・回復のために、オペレーターの認知負荷が高まります。この認知負荷を低減するために、統計解析・機械学習の技術により、運用データを活用して、運用タスクを効率的に自動化するAIOpsが注目されています。しかし、日本国内では、AIOpsの研究や現場での活用がまだ少なく、現段階ではAIOpsは広く認知されていません。 AIOps認知の一環として、本発表では、AIOps領域のうち、システム障害の原因を診断するタスクに着目し、先行研究、時系列解析・因果関係推定のためのモデルの構築、モデルの評価、運用データ生成システムの開発、MLOpsツールを用いた実験管理を、発表者の試行錯誤の過程での失敗も含めて、紹介します。
Topotal では SRE を募集しています
Topotal について
Topotal は「ソフトウェアで余裕を生み出す」をミッションに掲げ、SRE を基軸にサービス・プロダクトを提供するテクノロジーカンパニーです。 「同じような障害が何度も起きてしまう」、「サービスの拡大に伴うアクセス増加に対応できない」といった事業課題を解決するために、SRE 技術支援サービスとインシデントレスポンス SasS を提供しています。
お問い合わせ