運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#41(11/8~11/13)

この記事は2020/11/8~11/13発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残したものです。


  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #515 November 8th, 2020
SRE Weekly Issue #243 November 8th, 2020
KubeWeekly #241 November 14th, 2020

English Version of this blog is here.

  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2019年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #515 November 8th, 2020


BPF is already super interesting. With BTF and CO-RE the distribution story gets much easier, with the ability to provide standalone executables that don’t rely on compilers and other tools on the client.
  • タイトルは「BPF binaries: BTF, CO-RE, and the future of BPF perf tools」。
  • BTFとCO-REは以下の略語。この2つの新しいテクノロジーの可能性と、内容について解説しているBrendan Gregg氏のブログ投稿。
    • BTF: BPF Type Format
    • CO-RE: BPF Compile-Once Run-Everywher
Both Go, and more recently Rust, are increasingly popular for infrastructure tooling. This post has a nice comparison of the languages, looking at the main similarities and differences.
  • タイトルは「Rust vs Go」。
  • RustとGo言語の友好的で、公平な比較を試みている記事。両方の長所、適したユースケース、類似点、違いにフォーカスしていて、両方触ってみることを推奨。タイトルはわかりやすく vs を付けていますが、比較記事としては良心的で良いと感じた。
A talk I gave recently about configuration security. The move to infrastructure as code brings with it some interesting security challenges, the slides talk about some patterns to help address.
  • タイトルは「Configuration security is a developer problem」。
  • このメルマガ、DEVOPS WEEKLYのEditorであるGareth Rushgrove氏の最近行われたプレゼンのスライド。セキュリティー観点のコンフィグ管理の課題提起からの提案がわかりやすい。
A quick look at the future of OpenTelemetry and the place of open standards in advancing the state of the art of the observability and monitoring tool.
  • タイトルは「Reminiscing control theory and the future of observability」。
  • 先週のKubeWeeklyで取り上げているため、割愛します。
A nice introduction to contract testing, and the problem it solves. Having problems scaling integration tests? Features a Node.js example but it’s applicable to other stacks too.
  • タイトルは「Contract Testing for Node.js Microservices with Pact」。
  • 内容はタイトル通り。Pact、Contract Testはどちらも興味深かった。
  • 最近、Kentaro Wakayama氏の記事がこちらのメルマガで連続で取り上げられていますね。
A post on some of the challenges with serverless architectures. It mainly makes the case the the disadvantages and challenges are trade offs that you should make for other advantages, which sometimes is going to be true and at other times now.
A nice introduction to using Traefik for canary deployments and weighted load balancing.
  • タイトルは「Traefik: canary deployments with weighted load balancing」。
  • Traefikの加重ロードバランシングのカナリーリリースの、Traefikバージョン1と2での比較記事。
  • 私は「Traefik」自体を使ったことは無く、記事を読んできたけだったが、バージョン1と2で構成イメージから全然違って面白かった。


WTF is Cloud Native, and Why Should I Care? Find out the answers to both of these questions in a special webinar hosted by Pini Reznik, co-founder of Container Solutions. Join him 12 November at 13:00 CET. This free, 90-minute event is part of the Bristol tech Festival. Register now.
  • 先週に続き、Container Solutions社のイベントを取り上げている。上記の通り、90分の講座が開催予定。11/12(木) 13:00CET(Central European Time zone)なので、日本時間では21:00開始。


GitOps: What You Need to Know Now,a new e-book by Ian Miell, a Cloud Native engineer at Container Solutions, explains what this workflow is, the problems it was intended to solve, and how it does that. It also compares some common GitOps tools and explores alternatives. Get your free copy here:
  • 今週はToolsのコーナーがなく、BookでContainer Solutions社提供の無料e-book「GitOps: What You Need to Know Now」を紹介している。
  • フルネームとメールアドレスを入力すれば、メールでダウンロードページを案内される。分量は38ページ。

SRE Weekly Issue #243 November 8th, 2020


Keeping Netflix Reliable Using Prioritized Load Shedding

Sometimes I come across a simple but mind-blowingly awesome new idea. This is one of those times.

During periods of high load and errors, Netflix’s edge load balancer sends feedback to the apps running on users’ devices, adjusting their retry and backoff strategy to keep the service running as smoothly as possible but avoid a thundering herd. Brilliant.

Manuel Correa, Arthur Gonigberg, and Daniel West — Netflix

  • 多くの方が利用されているNetflix社の動画配信サービスをいかに支えているかを紹介しているテックブログの記事。
  • リクエストの分類、優先順位付けに応じた負荷分配(Prioritized Load Shedding)、Chaos Testingの取り組みにより、SPS(Stream Per Second)が遅くなる様な視聴者への影響を発生させずに復旧できる様になった。スゴイ。。。
  • こちらのブログでも毎週のように、このブログの記事から取り上げている。Chaos Engineering、中央集権的なSREチーム(CORE)などを始め、常に改善の取り組みを実施し、発信もしているこのテックブログはオススメ。サービスが身近でイメージし易く、多くの人が注目していて、この記事も1.2Kも拍手がされている(2020/11/14時点)。
Correlation in Latency Analysis

I helped to invent new approaches to correlate telemetry signals (exemplars, correlation between tracing and logging, profiler labels) that helped our engineers to navigate latency problems faster.

  • 筆者がGoogle在籍時に、AWSの筆記面接を受けた際の下記質問への回答を記事にしている。内容自体も興味深いし、「自身にそういった投げ掛けを常にしておかねば」と思った。
    • “What is the most inventive or innovative thing you’ve done? It doesn’t have to be something that’s patented. It could be a process change, product idea, a new metric or customer facing interface — something that was your idea… [retracted]
Scaling Live streaming for millions of viewers

Facebook has two very different users for live streaming: “normal” users and broadcasters streaming sporting events and the like.

Hemal Khatri, Alex Lambert, Jordi Cenzano and Rodrigo Broilo — Facebook

  • Facebook社のライブストリーミングにおける取り組みを解説している。
  • UEFA Champions League final、大晦日とイベントによって異なるトラフィックに対しての対応、新しい海底ケーブルの敷設、ISPとの協力など多くの取り組みの一端が見れて興味深かった。
Debugging incidents in Google’s distributed systems

This article covers the outcomes of research performed in 2019 on how engineers at Google debug production issues, including the types of tools, high-level strategies, and low-level tasks that engineers use in varying combinations to debug effectively.

Charisma Chan and Beth Cooper — Google

  • Googleのエンジニアが本番環境の問題をデバッグする方法を探るため、2019年に実施された調査の結果について説明している。エンジニアがさまざまな組み合わせで効果的にデバッグに使用するツールの種類、高レベルの戦略、低レベルのタスクなどに関して調査している。
Basic patterns in how adaptive systems fail

The three patterns discussed in this paper are:

  • decompensation
  • working at cross purposes
  • getting stuck in outdated behaviors

David Woods and Matthieu Branlat

  • 「Resilience Engineering in Practice」の10章「Basic patterns in how adaptive systems fail」のリンク。解説されている3つのベーシックなパターンは上記の通り。



KubeWeekly #241

The Headlines

Editor’s pick of the highlights from the past week.

Don’t forget to register for KubeCon + CloudNativeCon North America Virtual 2020!

KubeCon + CloudNativeCon North America 2020 Virtual — THE open source conference of the year — is happening next week, November 17- 20. Have you reserved your spot?

Join us for nearly 200 sessions and the opportunity to hear from the cloud native community. Register now and begin planning your week today!

  • いよいよ開催まで数日。ここで案内するのもラストですね。

ICYMI: CNCF Webinars

You can view all CNCF recorded and upcoming webinars here.

CNCF Member webinar: Developer-friendly platforms with Kubernetes and infrastructure as code

Lee Briggs, Staff Software Engineer @Pulumi

  • DevOpsの運用側だけでなく開発者側にも馴染みのある言語を使用してKubernetesベースのプラットフォームを構築する方法を解説している。
  • 開発者がKubernetesの構成、管理、デプロイのタスクを自動化し、運用知識のレベルアップするのに役立つテクニックが紹介されている。
CNCF Member webinar: Kubernetes in the context of on-premises edge and network edge computing

Amr Mokhtar, Network Software Engineer @Intel Corporation and Prakash Kartha, Segment Director @Intel Corporation

  • オープンソースのリファレンスクラウドネイティブアーキテクチャーであるOpenNESS(Open Network Edge Services Software)を紹介している。以下の様な機能を提供する。
    • Abstracted platform & network complexity
    • Enhanced dataplane
    • Hardware accelerators management
    • Dynamic discovery & optimal apps/services placement
    • Open integration with Cloud Native Functions (CNFs)
CNCF Member webinar: MicroK8s HA under the hood: Kubernetes with Dqlite

Konstantinos Tsakalozos, Senior Software Engineer @Canonical

  • テーマに沿って、Canonicalのチームが、地球上で最も広く使用されているデータベース(SQLite)をどのように配布したのか、このような分散データベースに対する自動化されたdevopsがシームレスなHAを提供する方法について、解説している。
CNCF Project webinar: What’s new in Linkerd 2.9: mTLS for all TCP connections, ARM support, and more

Oliver Gould, Linkerd creator and CTO @Buoyant

  • Linkerdの作成者であるOliver Gould氏が、Linerdバージョン2.9を下記のポイントで解説している。
    • Linkerd performs encryption and authentication to the pod boundary, providing “encryption in transit” in a modern, zero-trust form.
    • The new multi-core proxy runtime further improves performance over Linkerd’s already lightning-fast latency profile
    • Linkerd’s new service topology support can provide significant performance improvements and cost savings for Kubernetes applications
    • What the future of Linkerd holds!
CNCF Member webinar: DevOps from a different data-set: what 11 million workflows reveal about high performing teams

Mike Stahnke, VP of Platform @CircleCI and Ron Powell, Technical Content Manager @CircleCI

  • 数百万のDevOpsワークフローからの匿名化されたチームデータのビューを取り上げ、チームがより優れたソフトウェアをより迅速に構築するのに役立つ洞察、行動、指標を共有している。

The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Geographically Distributed Stateful Workloads Part One: Cluster Preparation

Raffaele Spazzoli, Red Hat

  • ステートフルなアプリを3つのクラウドリージョンにデプロイし、RTOとRPOをほぼゼロにする方法について解説している。
powerfulseal/powerfulseal: A powerful testing tool for Kubernetes clusters
  • Kubernetesクラスターに障害を注入し、問題をできるだけ早く検出するカオスエンジニアリング用のツール「PowerfulSeal」のGitHubページ。
Create your first Knative app

Jessica Cherry, opensource.com

  • KnativeとMinikubeを使用して、アプリを動かすチュートリアル。
How to use Docker Security Scan Locally

Brian Christner

  • Docker社とSnyk社のパートナーシップにより実現した、ローカル環境でコンテナの脆弱性スキャンを行う「Docker Scan」を紹介している。
  • ビルドしたイメージと、Dockerfileを参照させるとDockerfileのどのレイヤーに脆弱性があるかも表示される。
Seccomp for Fun and Profit

Jim Ramsay, Red Hat

  • NET_ADMINの一部の権限の制限をseccompで行えるかチャレンジし、解説している記事。
metal3-io/baremetal-operator: Bare metal host provisioning integration for Kubernetes
Low-budget self-hosted Kubernetes

Tobias Hübner

  • 「Kubernetesは、かなりの大規模なプロジェクトでのみ使用するものである必要は無く、中小企業にも無数のメリットがある」として、「独自のクラスターをセットアップするための実践的なチュートリアルと、クラスターを真に機能させるために必要なすべてのものを提供すること」をゴールに解説しているシリーズ。4つのPartに分けて公開されている。
Platforms on k8s with Golang – Watch any CRD

Ryan Dawson, Hackernoon

  • 既成のアプリを実行するよりもKubernetesを利用して多くのことをしたい場合に、Golangを使用すると、Kubernetesとやり取りするための柔軟性が大幅に向上することを解説している。

The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Announcing Linkerd 2.9: mTLS for all, ARM support, and more!

William Morgan, Linkerd

Linkerd, with Thomas Rampelberg

Adam Glick and Craig Box, Kubernetes Podcast from Google

Episode 42 – Veterans Day Special with Red Hat’s Chris Short and Marky Jackson

Dan Papandrea (Sysdig), Chris Short (Red Hat), Marky Jackson (Equinix Metal)

  • 「Veterans:退役軍人」をテーマにしたPodcastで、上記のメンバーが出演している。日本だとこの手のテーマに触れる機会が少ないので興味深かった。
Chaos Experiments on Kubernetes using Litmus to ensure your cluster is production ready

Saiyam Pathak, Civo

  • KubernetesクラスターでChaos Experimentを行うためのオープンソースツール「Litmus」のKubernetesクラスターへのインストールと、以下のexperimentsの作成/実行を行っているチュートリアル。
    • Pod Deletion
    • Pod Autoscaler
China’s government-anointed Git operator says it will become a Linux Foundation mirror

Simon Sharwood, The Register

  • 「Gitee」という名前の中国のGit-as-a-serviceの一団(outfit)がLinux Foundationと契約を結び、Linux FoundationのプロジェクトをGreat Firewallの背後にミラーリングしたとのこと。現在は2つのプロジェクト、エッジコンピューティング「Baetyl」と IoTエッジコンピューティングフレームワーク「EdgeX Foundry」のみだが、Gitee曰く今後全てのプロジェクトをミラーリングしていくとのこと。Linux Foundationも以下の様に認めている模様。
    • The Linux Foundation has confirmed the new relationship.
CNCF Releases Free Training Course Covering Basics of Service Mesh with Linkerd


  • CNCFとLinux Foundationによる、Linkerdを使用したServiceMeshの新たなトレーニングコース「Introduction to Service Mesh with Linkerd」の紹介。
  • 誰でも無料で聴講可能。修了証明書が必要な場合は、$149でアップグレード可能。
  • SRE、DevOpsプロフェッショナル、クラスター管理者、およびサービスメッシュとLinkerdについて詳しく知りたい開発者が対象。
  • KubeWeekly、今週は特にLinkerdをパワープッシュしていますね。
What Will It Take to Shift Kubernetes Security Left?

Bill Doerrfeld, Container Journal

  • 「Kubernetesの専門家が、潜在的な問題を検出するためにポリシー主導の自動化を実施して、セキュリティの予見を開発の早い段階で行うこと」をタイトルの「Shift Kubernetes Security Left」と本文で表現し、その必要性に冒頭で触れ、以下の4つを組み合わせて対応する必要性を解説している。
    • Policies
    • Integrative Security Tooling
    • Developer Experience
    • Great Error Messages
Amazon Web Services will build its own public registry for Docker container images

Mike Wheatley, SiliconANGLE

  • 11月2日から開始されているDocker Hubのイメージプルレートの制限に対して、AWSが発表した新しいパブリックコンテナレジストリの提供について解説している。
vSphere 7 with Tanzu Integrates with HAProxy for Load Balancing Enterprise-grade Kubernetes


  • タイトルの通り、VMware社がHAProxy Technologies社と提携して、HAProxyロードバランサーをvSphere 7に統合し、Tanzu KubernetesクラスターのデフォルトのロードバランサーとしてHAProxyを採用している。

Upcoming CNCF webinars


Member Webinar: Discover, analyze, and secure your APIs…anywhere
Pranav Dharwadkar, VP of Products @Volterra.io
Jakub Pavlik, Director of Engineering @Volterra.io
Dec 1, 2020 10:00 AM Pacific Time

Member Webinar: A look at how hackers exploit Prometheus, Grafana, Fluentd, Jaeger & more
Omer Levi Hevroni, Application Security Engineer @Synk
Dec 8, 2020 10:00 AM Pacific Time

Member Webinar: Metal³: Kubernetes-native bare metal host management
Maël Kimmerlin, Senior Software Engineer @Ericsson Software Technology
Dec 10, 2020 10:00 AM Pacific Time




Bye now!!

Yoshiki Fujiwara