運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#84(2021/9/5~9/10)

The English Version of this blog is here.

この記事は2021/9/5~9/10発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #558 September 5th, 2021
SRE Weekly Issue #286 September 5th, 2021
KubeWeekly #276 September 10th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #558 September 5th, 2021

News

A good introduction to error budgets and using them to make trade-offs between risk and stability.
  • タイトルは「Data-driven negotiation with SLIs, SLOs and Error Budgets (2/2)」。エラーバジェットを使用してデータ駆動型の方法でネゴシエートする方法、イノベーションと信頼性の間、およびリスクと安定性の間のトレードオフを解説している。
  • 前回の投稿はこちら。ユーザーの幸福を最大化する最適なレベルのソフトウェアの信頼性を提供することを最終目標として、SLIとSLOを使用してユーザーの幸福をメトリック形式でキャプチャすることを解説している。
An interesting post on modern ransomware and malware attacks and now to mitigate and deal with the fallout.
  • 上記内容の2つの記事のセット。1つ目の上記リンクのタイトルは「The rise of ransomware」。組織がランサムウェア攻撃に対応するのを支援しながら見えてきた傾向の洞察として、ランサムウェアが以下2つの面でどのように進化したかを提供している。
    • hybrid business models for monetisation
    • increasingly sophisticated (and targeted) methods of deployment
  • 2つ目の記事は「Mitigating malware and ransomware attacks」。民間および公共部門の組織がマルウェア(ランサムウェアを含む)の影響に対処するため、マルウェアの感染を防ぐのに役立つアクションと、すでに感染している場合に実行する手順を提供している。
A handy pattern for when you need to create new repositories based on a template and some variables, using GitHub repository templates, Actions and the python cookiecutter tool.
A look at the security profile operator for Kubernetes. This exposes a first-class interface for configuring seccomp profiles amongst other useful features including exposing metrics and enriching logs.
  • タイトルは「Managing Kubernetes seccomp profiles with security profiles operator」。
  • 先週のKubeWeekly #275で取り上げているため、割愛。
The first two parts of a series on building an analytics platform based on Druid. Background on technology choice and lots of technical details about the implementation.
  • 上記の通り、Pinterest社のDruid上のAnalytics as a Platformについて説明し、Druidの使用して得た学びを共有ししているシリーズ物の記事。
  • 上記リンクの1つ目のタイトルは「Pinterest’s Analytics as a Platform on Druid (Part 1 of 3)」。以下の構成で解説している。
    • A Short History on Switching to Druid
    • Architecture
    • Learnings on Optimizing Host Types for Mmap
    • Memory Optimized Host Types
    • IO Optimized Host Types
    • Future work
    • Acknowledgements
  • 2つ目の記事は「Pinterest’s Analytics as a Platform on Druid (Part 2 of 3)」。以下の構成で解説している。
    • Learnings on Optimizing Druid for Batch Use Cases
    • Future work
    • Acknowledgements
A post looking at the role of an SRE team in adopting observability tooling. A lot of this depends, in my experience, on the reality on the ground of roles vs the titles.
  • タイトルは「The Role of SREs in Observability」。
  • SREが可観測性で果たす役割の概要を以下の構成で解説している。
    • A brief history of SREs and observability
    • SREs and the observability revolution
    • Observability requires expertise with disparate data sources and systems
    • Observability and reliability go hand-in-hand
    • SREs excel at incident response
    • Observability beyond SREs

Events

Kubernetes Community Days UK is coming up on the 15th and 16th September. A virtual event over 2 days, with talks on supply chain security, secrets, scaling, getting started with Kubernetes and lots more.
  • 上記の通り、2021/09/15-09-16に開催される「Kubernetes Community Days UK 2021」の紹介。
  • 申込時にSwagはUK Onlyになっているので、日本居住の方は選択肢に注意を。登録はシンプルなので、数秒で終わります。

Tools

There is so much interesting information in Git and GitHub metadata. Askgit is a CLI tool for exposing that data via a SQL interface to make it easier to use.
  • gitリポジトリでSQLクエリを実行するためのコマンドラインツール「askgit」のGitHubページ。
Monika is a nice and simple monitoring tool. Define probes for URLs in a config file, what failure looks like and how you want to be notified of any issues. It also supports Postman and HAR files as input.
  • oclifフレームワークを中心に構築されたtypescriptで記述されたnode.jsアプリケーション「Monika」のGitHubページ。
  • Webページはこちら

SRE Weekly Issue #286 September 5th, 2021

Articles

Kill It With Fire

This is a review of Marianne Bellotti’s Kill It With Fire a book about modernizing legacy systems. It focuses heavily on operational concepts and “the system around the system”, with a heavy SRE influence.

Laura Nolan — ;login:

  • 上記のEditorのコメント同様、この書評の筆者も下記のようにキーワードである「the system around the system」を引用して同書を紹介している。
    • Kill it With Fire is a useful and highly readable guide to solving these problems by leveraging the organisation — the system around the system.
Why every software engineering interview should include ops questions

Originally drafted in 2016, this blog post is even more relevant now. Beyond just the “why”, it has several ideas for interview questions to get you started.

Charity Majors

  • タイトルの内容に沿って以下のポイントで解説している。
    • STOP TELLING OPS PEOPLE TO CODE BETTER, START TELLING SWES TO OPS BETTER
    • EVERY SOFTWARE ENGINEERING INTERVIEWING LOOP SHOULD HAVE AN OPS COMPONENT.
    • OPS QUESTIONS FOR SOFTWARE ENGINEERS
    • SIGNALS TO LOOK FOR
The power of framing a problem

Tell a good story, and you can make things happen.

As SREs, we often know what needs to be done, but convincing others is a hard-won skill.

Lorin Hochstein

  • 再び「Kill It With Fire」から。筆者が共感した部分を抜粋し、storytellingの重要性を強調している。
Easyjet A320 tells United Boeing 787 to GO AROUND!

In this video report of a commercial aviation accident, there’s a neat discussion of resiliency toward the end. There were several other layers of protection that (probably) would have caught and prevented this incident if the A320 captain hadn’t intervened. And even though no accident occurred, there was still a “near miss” investigation.

Mentor Pilot

  • 上記Editorのコメント通り、航空機のインシデントを取り上げて丁寧に解説している約19分間のYouTube動画。
The Role of SREs in Observability

Although conversation about observability often ignores SREs, SREs have a central role to play in observability success.

Quentin Rousseau — Rootly

  • 上記DEVOPS WEEKLY ISSUE #558で取り上げているため、割愛。
Cascading retries and the sulky applications

In a microservice architecture, having retries several levels deep can be a recipe for nastiness.

Oren Eini — RavenDB

  • 上記のタイトルとEditorのコメント通り、マイクロサービスアーキテクチャーにおける複数レベルのリトライ処理で発生し得る問題についてコードを示して解説している。
GitHub Availability Report: August 2021

This report has some detail on two major incidents experienced by GitHub last month.

Scott Sanders — GitHub

  • GitHub社の月次の「Availability Report」の8月分。8月に発生した2件のインシデントの事象、対応、対策などが解説されている。
  • 私は最近、status pageでSubscribeからstatus updates(creates, updates, or resolves an incident)の通知が受けられることに気づき、早速設定してみた。

Outages

上記各社の障害情報。


KubeWeekly #276 September 10th, 2021

The Headlines

Editor’s pick of the highlights from the past week.

How Seagate runs real-time analytics at the Edge

With global data creation predicted to hit 180 zettabytes by 2025, leading data storage provider Seagate needed to introduce greater automation at immense scale to its operations, to ensure it could keep pace with growing demand. Learn more by reading the full case study.

  • CNCFの上記の「Seagate社のedgeRX project」のケーススタディーを紹介しているページ。full case studyはこちら

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Kubernetes clusters need persistent data

James Spurin, StorageOS

  • タイトルに沿って以下のポイントを解説している約57分間のセッション。落ち着いた語り口で資料がわかりやすく構成されていて、良い視聴体験。
    • The benefits and opportunities for significantly improving Kubernetes usage across your organisation via the use of an effective data plane.
    • Opportunities including multi-tenancy, high availability, compliance with encryption at rest
    • The ease of use with GitOps and the transition of traditional and legacy workloads, dependent on persistent data.


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Kubernetes CI/CD pipelines: What, why, and how

Alex Chalkias, Ubuntu

  • 以下を対象に、最先端のオープンソースDevOpsツールを使用してKubernetes CI/CDワークフローの設定方法に関する情報を提供している。
    • A developer at the start of your journey with enterprise software
    • An experienced software engineer working on your company’s applications, or
    • An engineering lead trying to improve your team’s productivity
Prometheus definitive guide part III - Prometheus Operator

Ninad Desai, InfraCloud Technologies

  • Prometheus OperatorとHelmを簡単に使用してKubernetesクラスターにPrometheusをインストールして管理する方法に焦点を当て、コード/図/Web UI/ターミナル画面などを示しながら丁寧に解説している。
  • Prometheusを始めたばかりの場合は、この「Prometheus Definitive Guide」シリーズの最初の2部を読むことを強くお勧めしている。
Sqlcommenter merges with OpenTelemetry

Nimesh Bhagat, Google Cloud

  • オープンソースのORM(object-relational mapping)auto-instrumentationライブラリである「Sqlcommenter」の、オープンソースの可観測性フレームワークである「OpenTelemetry」への統合の発表と、その紹介。パートナー各社(Datadog/Dynatrace/Splunk)のコメントや使用例を挙げている。
Gracefully handling Kubernetes API deprecations: The tale of two ingresses

Lucas Roesler, Contiamo

  • OpenFaaSがKubernetes Discovery APIを使用して、すべてのKubernetesバージョンでIngressの下位互換性を提供する方法を解説している。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Ingress-nginx, with Alejandro de Brito Fontes and Ricardo Katz

Craig Box, Kubernetes Podcast from Google

How Docker broke in half

Scott Carey, InfoWorld

  • Mirantis社にエンタープライズビジネスを売却するなど、Docker社がどのように崩壊したのか、12人以上の元および現在のDocker従業員、オープンソースのcontributor、顧客、および業界アナリストへのヒアリング内容を元に解説している。
  • Docker社に関する知らなかったストーリーが諸々語られていて興味深い。例えば以下。
    • Craig McLuckie, Kubernetes cofounder and now vice president at VMware, says he offered to donate Kubernetes to Docker, but the two sides couldn’t come to an agreement.
Infrastructure management going extinct with serverless

Jakub Lewkowicz, SD Times

  • タイトルにある筆者の考えに沿って以下のポイントで解説している。
    • Abstracting away Kubernetes
    • Vendors are defining serverless
    • All eyes are on serverless at the edge
    • Serverless is the architecture for volatility
    • A serverless future: A tale of two companies
Service Mesh 102: Envoy configuration

Scott Lowe, Kong

DZone Live - The KubeCon episode
  • KubeCon + CloudNativeCon North Americaに向けて複数のゲストにそれぞれインタビューして、最後に全員揃って語っている約75分間のYouTubeのセッション動画。

Upcoming CNCF Online Programs

*edited as the Kubernetes 1.22 release webinar has been rescheduled

Live Webinar
Cloud Native Live
On-demand

Looking for more great curated content? Visit our Online Programs playlist on YouTube.

Learn more about CNCF Online Programs

いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara