運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#89(2021/10/10)

The English Version of this blog is here.

この記事は2021/10/10発行の下記2つのWeekly Report(KubeWeeklyが休みのため)を読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #563 October 10th, 2021
SRE Weekly Issue #291 October 10th, 2021
KubeWeekly #281 October 29th, 2021←KubeCon + CloudNativeCon NA 2021に伴い、2週間お休み
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #563 October 10th, 2021

News

  • タイトルは「The Insecure Software Supply Chain」。
  • 上記のEditorのコメント通り、最近の例や脅威のカテゴライズ、関連するオープンソースプロジェクトの紹介がされている。スライドのフォント見せ方が統一されていて非常に見やすい。
Slides with a great update on the state of devops in 2021, featuring recent research and looking at SPACE, a framework for measuring productivity.
  • タイトルは「Why Even DevOp」。
  • DevOpsによるテクノロジーの変革が、ソフトウェアをスピードと安定性をもって提供するのに役立つだけでなく、燃え尽き症候群を減らし、文化を改善し、コミュニケーションを改善する方法を解説している。生産性についても分析している。
Anything that helps get away from credentials in CI pipelines is a good thing. This post looks at federated ID, and specifically OpenID Connect usage in GitHub Actions.
  • タイトルは「Deploy without credentials with GitHub Actions and OIDC」。
  • GitHub Actionsの新機能でOIDC(OpenID Connect)を作成できるようになった。これをOpenFaaSと統合して、GitHub上のユーザーのセットリストをクレデンシャルを付与せずにOpenFaaSクラスターにデプロイする方法を解説している。
Kubernetes now has dual stack networking support, for IPv4 and IPv6. This post is a nice behind-the-scenes look at the hard work behind the scenes to implement such a large feature.
  • タイトルは「Dual-Stack Networking in Kubernetes」。
  • 上記のEditorのコメント通り、KubernetesでIPv4/IPv6デュアルスタックがサポートされた舞台裏でのこれまでの取り組みが述べられている。
A look at the 2021 Accelerate State of Devops Report, with observations about the relationship between Devops and SRE, risk taking, multi-cloud and security.
  • タイトルは「Google’s State of DevOps 2021 Report: What SREs Need to Know」。
  • 完全なレポートは45ページの長さにわたり、レポートの公式の焦点はSREではなくDevOps。この調査結果からSRE向けに最も重要なポイントを抜粋して解説している。
A post on the new OpenEBS release, which also acts as a good introduction to container attached storage in Kubernetes.
  • タイトルは「Why OpenEBS 3.0 for Kubernetes and Storage?」。
  • OpenEBS 3.0のリリースに合わせた記事。データにKubernetesを使用する際の背景から始め、OpenEBS 3.0のさまざまな拡張機能と、KubernetesストレージにOpenEBSを使用する利点を解説している。

Tools

CloudGraph is a GraphQL powered search engine for your cloud infrastructure. Handy for a number of use cases. The docs have some nice query examples too.
  • クラウドインフラストラクチャーと構成に対してクエリするツール「CloudGraph」のGitHubページ。

SRE Weekly Issue #291 October 10th, 2021

Articles

Understanding How Facebook Disappeared from the Internet

Facebook’s outage caused significantly increased load on DNS resolvers, among other effects. Cloudflare also published this followup article with more findings.

Celso Martinho and Sabina Zejnilovic — Cloudflare

  • Facebook社の2021/10/4に発生した障害をCloudflare社の視点で解説している。
  • Facebook社からは「Update about the October 4th outage」と「More details about the October 4 outage」が障害の更新情報と詳細のブログが公開されている。詳細の記事は後の方で個別にピップアップされているので、そちらで触れる。
The New Norm

Shell (the oil company) reduced accidents by 84% by teaching roughnecks to cry. Listen to this podcast (or check it out in article form to find out how. Can we apply this to SRE?

Alix Spiegel and Hanna Rosin — NPR’s Invisibilia

  • 2つのストーリーを通して社会的規範とそれに変化を起こすこと、その影響を語っているPodcastとその概説記事。Editorは「これをSREに適用できないか?」と投げ掛けている。2016/6/17の記事。
Google’s State of DevOps 2021 Report: What SREs Need to Know

Don’t have time to read Google’s entire report? Here are the highlights.

Quentin Rousseau — Rootly

  • 上記DEVOPS WEEKLY ISSUE #563で取り上げているため、割愛。
More details about the October 4 outage

I really like how open Facebook engineering has been about what went wrong on Monday. This article is an update on their initial post.

Santosh Janardhan — Facebook

  • Facebook社が2021/10/4に発生した障害の詳細を報告、公開しているブログ。
  • データセンターとインターネット間のサーバー接続が完全に切断、BGPの経路広報の停止によるDNSサーバーへのアクセス不可が発生。
  • 復旧のため、オンサイトでのエンジニアによる作業を手配したが以下の理由により時間が掛かった。
    • 施設が高レベルの物理的およびシステムセキュリティーを念頭に置いて設計されている
    • ハードウェアとルーターは、物理的にアクセスできる場合でも変更が難しいように設計されているため、エンジニアが作業するためのアクセスプロトコルの有効化が必要
Tools to explore BGP

Want to learn about BGP? Ride along as Julia Evans learns. I especially like how she whipped out strace to figure out how traceroute was determining ASNs.

Julia Evans

  • 上記のFacebook社の障害がBGPが原因の一つとなっているので、筆者がBGP情報を検索する方法をまとめた記事が見当たらなかった。そこでツールを求めるツイートを行なった結果、多くの情報が集まった。その中から、BGP情報を検索するために使用できるいくつかのツールを紹介している。
Announcing the VOID

The Verica Open Incident Database is an exciting new project that seeks to create a catalog of public incident postings. Click through to check out the VOID and read the inaugural paper with initial findings. I’m really excited to see what this project brings!

Courtney Nash — Verica

  • インシデントに関する新しい、より良い質問とコミュニティディスカッションを生成するために、公開ソフトウェア関連のインシデントレポートを1か所ですべての人が利用できるようにするプロジェクト「VOID (Verica Open Incident Database)」のリリース発表。
‘date -d’ vs. ‘date -s’, and ‘show foo’ vs. ‘clear foo’

Printing versus setting a date — they’re only separated by a typo. Perhaps something similar happened with Facebook’s outage.

rachelbythebay

  • CLIで意図しない操作を行う例を挙げ、Facebook社の障害に対しての噂などに触れている。
SRE Doesn’t Scale

Adopting a microservice architecture can strain your SRE. This article highlights an oft-missed section of the SRE book about scaling SRE.

Tyler Treat

  • タイトルに沿って、SRE本で見逃されがちな chapter 32 に焦点を当てて、このブログの筆者の意見が述べられている。

Outages

上記各社の障害情報。


KubeWeekly #281 October 29th, 2021←KubeCon + CloudNativeCon NA 2021に伴い、2週間お休み


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara