SRE / DevOps / Kubernetes Weekly Reportまとめ#89(2021/10/10)
- The English Version of this blog is here.
- この記事は2021/10/10発行の下記2つのWeekly Report(KubeWeeklyが休みのため)を読み、備忘録兼リンク集として残しているものです。
- なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。
- DEVOPS WEEKLY ISSUE #563 October 10th, 2021
- News
- Supply chain security is an increasingly important topic. This presentation explains why it’s important, with well explained recent examples and a breakdown of the SLSA framework for categorizing threats and related open source projects.
- Slides with a great update on the state of devops in 2021, featuring recent research and looking at SPACE, a framework for measuring productivity.
- Anything that helps get away from credentials in CI pipelines is a good thing. This post looks at federated ID, and specifically OpenID Connect usage in GitHub Actions.
- Kubernetes now has dual stack networking support, for IPv4 and IPv6. This post is a nice behind-the-scenes look at the hard work behind the scenes to implement such a large feature.
- A look at the 2021 Accelerate State of Devops Report, with observations about the relationship between Devops and SRE, risk taking, multi-cloud and security.
- A post on the new OpenEBS release, which also acts as a good introduction to container attached storage in Kubernetes.
- Tools
- News
- SRE Weekly Issue #291 October 10th, 2021
- KubeWeekly #281 October 29th, 2021←KubeCon + CloudNativeCon NA 2021に伴い、2週間お休み
The English Version of this blog is here.
この記事は2021/10/10発行の下記2つのWeekly Report(KubeWeeklyが休みのため)を読み、備忘録兼リンク集として残しているものです。
なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。
- 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #563 October 10th, 2021
SRE Weekly Issue #291 October 10th, 2021
KubeWeekly #281 October 29th, 2021←KubeCon + CloudNativeCon NA 2021に伴い、2週間お休み
- この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
- 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
- 情報量が多いので文字とリンクだけに絞っております。
- 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。
DEVOPS WEEKLY ISSUE #563 October 10th, 2021
News
Supply chain security is an increasingly important topic. This presentation explains why it’s important, with well explained recent examples and a breakdown of the SLSA framework for categorizing threats and related open source projects.
- タイトルは「The Insecure Software Supply Chain」。
- 上記のEditorのコメント通り、最近の例や脅威のカテゴライズ、関連するオープンソースプロジェクトの紹介がされている。スライドのフォント見せ方が統一されていて非常に見やすい。
Slides with a great update on the state of devops in 2021, featuring recent research and looking at SPACE, a framework for measuring productivity.
- タイトルは「Why Even DevOp」。
- DevOpsによるテクノロジーの変革が、ソフトウェアをスピードと安定性をもって提供するのに役立つだけでなく、燃え尽き症候群を減らし、文化を改善し、コミュニケーションを改善する方法を解説している。生産性についても分析している。
Anything that helps get away from credentials in CI pipelines is a good thing. This post looks at federated ID, and specifically OpenID Connect usage in GitHub Actions.
- タイトルは「Deploy without credentials with GitHub Actions and OIDC」。
- GitHub Actionsの新機能でOIDC(OpenID Connect)を作成できるようになった。これをOpenFaaSと統合して、GitHub上のユーザーのセットリストをクレデンシャルを付与せずにOpenFaaSクラスターにデプロイする方法を解説している。
Kubernetes now has dual stack networking support, for IPv4 and IPv6. This post is a nice behind-the-scenes look at the hard work behind the scenes to implement such a large feature.
- タイトルは「Dual-Stack Networking in Kubernetes」。
- 上記のEditorのコメント通り、KubernetesでIPv4/IPv6デュアルスタックがサポートされた舞台裏でのこれまでの取り組みが述べられている。
A look at the 2021 Accelerate State of Devops Report, with observations about the relationship between Devops and SRE, risk taking, multi-cloud and security.
- タイトルは「Google’s State of DevOps 2021 Report: What SREs Need to Know」。
- 完全なレポートは45ページの長さにわたり、レポートの公式の焦点はSREではなくDevOps。この調査結果からSRE向けに最も重要なポイントを抜粋して解説している。
A post on the new OpenEBS release, which also acts as a good introduction to container attached storage in Kubernetes.
- タイトルは「Why OpenEBS 3.0 for Kubernetes and Storage?」。
- OpenEBS 3.0のリリースに合わせた記事。データにKubernetesを使用する際の背景から始め、OpenEBS 3.0のさまざまな拡張機能と、KubernetesストレージにOpenEBSを使用する利点を解説している。
Tools
CloudGraph is a GraphQL powered search engine for your cloud infrastructure. Handy for a number of use cases. The docs have some nice query examples too.
- クラウドインフラストラクチャーと構成に対してクエリするツール「CloudGraph」のGitHubページ。
SRE Weekly Issue #291 October 10th, 2021
Articles
Understanding How Facebook Disappeared from the Internet
Facebook’s outage caused significantly increased load on DNS resolvers, among other effects. Cloudflare also published this followup article with more findings.
Celso Martinho and Sabina Zejnilovic — Cloudflare
- Facebook社の2021/10/4に発生した障害をCloudflare社の視点で解説している。
- Facebook社からは「Update about the October 4th outage」と「More details about the October 4 outage」が障害の更新情報と詳細のブログが公開されている。詳細の記事は後の方で個別にピップアップされているので、そちらで触れる。
The New Norm
Shell (the oil company) reduced accidents by 84% by teaching roughnecks to cry. Listen to this podcast (or check it out in article form to find out how. Can we apply this to SRE?
Alix Spiegel and Hanna Rosin — NPR’s Invisibilia
- 2つのストーリーを通して社会的規範とそれに変化を起こすこと、その影響を語っているPodcastとその概説記事。Editorは「これをSREに適用できないか?」と投げ掛けている。2016/6/17の記事。
Google’s State of DevOps 2021 Report: What SREs Need to Know
Don’t have time to read Google’s entire report? Here are the highlights.
Quentin Rousseau — Rootly
- 上記DEVOPS WEEKLY ISSUE #563で取り上げているため、割愛。
More details about the October 4 outage
I really like how open Facebook engineering has been about what went wrong on Monday. This article is an update on their initial post.
Santosh Janardhan — Facebook
- Facebook社が2021/10/4に発生した障害の詳細を報告、公開しているブログ。
- データセンターとインターネット間のサーバー接続が完全に切断、BGPの経路広報の停止によるDNSサーバーへのアクセス不可が発生。
- 復旧のため、オンサイトでのエンジニアによる作業を手配したが以下の理由により時間が掛かった。
- 施設が高レベルの物理的およびシステムセキュリティーを念頭に置いて設計されている
- ハードウェアとルーターは、物理的にアクセスできる場合でも変更が難しいように設計されているため、エンジニアが作業するためのアクセスプロトコルの有効化が必要
Tools to explore BGP
Want to learn about BGP? Ride along as Julia Evans learns. I especially like how she whipped out strace to figure out how traceroute was determining ASNs.
Julia Evans
- 上記のFacebook社の障害がBGPが原因の一つとなっているので、筆者がBGP情報を検索する方法をまとめた記事が見当たらなかった。そこでツールを求めるツイートを行なった結果、多くの情報が集まった。その中から、BGP情報を検索するために使用できるいくつかのツールを紹介している。
Announcing the VOID
The Verica Open Incident Database is an exciting new project that seeks to create a catalog of public incident postings. Click through to check out the VOID and read the inaugural paper with initial findings. I’m really excited to see what this project brings!
Courtney Nash — Verica
- インシデントに関する新しい、より良い質問とコミュニティディスカッションを生成するために、公開ソフトウェア関連のインシデントレポートを1か所ですべての人が利用できるようにするプロジェクト「VOID (Verica Open Incident Database)」のリリース発表。
‘date -d’ vs. ‘date -s’, and ‘show foo’ vs. ‘clear foo’
Printing versus setting a date — they’re only separated by a typo. Perhaps something similar happened with Facebook’s outage.
rachelbythebay
- CLIで意図しない操作を行う例を挙げ、Facebook社の障害に対しての噂などに触れている。
SRE Doesn’t Scale
Adopting a microservice architecture can strain your SRE. This article highlights an oft-missed section of the SRE book about scaling SRE.
Tyler Treat
- タイトルに沿って、SRE本で見逃されがちな chapter 32 に焦点を当てて、このブログの筆者の意見が述べられている。
Outages
- Facebook, Instagram, WhatsApp, and Oculus
Well, that sure was a big one. Facebook and related services were totally down for 6+ hours — even their DNS servers.They also had another, smaller outage later in the week. - Slack
Not a real outage, but Slack reported that users were having a hard time connecting to Slack, because resolvers were overloaded by DNS lookups for facebook.com. - NordVPN
- PayPal
上記各社の障害情報。
KubeWeekly #281 October 29th, 2021←KubeCon + CloudNativeCon NA 2021に伴い、2週間お休み
いかがでしたか?気になる記事や情報はありましたか?
私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。
では、また。
Bye now!!