運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#68(2021/5/16~5/21)

この記事は2021/5/16~2021/5/21発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

DEVOPS WEEKLY ISSUE #542 May 16th, 2021
SRE Weekly Issue #270 May 16th, 2021
KubeWeekly #262 May 21st, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #542 May 16th, 2021

News


A post on the best way to present metrics on dashboards. Definitely relevant to anyone presenting information from monitoring or software development metrics.
  • タイトルは「Metric Display Standards」。
  • あらゆるユースケースのすべてのメトリックに信頼できるレベルのユーティリティー、使いやすさ、およびアクセシビリティーを提供する標準のオブジェクトモデルとデータプレゼンテーションについて解説している。
  • 内容のイメージ/理解が進む図が効果的に使われていて良い教材としてキープ。
A rebuttal to a post from last week, on how Backstage hopes to address some of the traditional issues described with developer portals.
  • タイトルは「Developer portals are a superpower」。
  • 先週取り上げている記事「developer portals are an anti-pattern」に対する反論記事。
  • 「Backstageが開発元であるSpotify以外で見られない」という主張に対しては、具体的にExpedia Group、Zalando、American Airlines社が社内の開発者ポータルとしてBackstageを選択していること、他にも採用している組織の情報が「many more participants listed」として、GitHub上の「ADOPTERS.md」に公開されていることを紹介している。
A couple of write ups from the recent KubeCon EU event. High level themes and details of various talks and tracks.
  • 2つの記事をまとめて取り上げている。1つ目の記事のタイトルは「KubeCon Europe 2021 Wrapup」。
    • 筆者にとって、3回連続のバーチャルでのKubeCon参加をふりかえっている。
    • 筆者は昨年は基調講演を含め、ほとんどのプログラムをライブで見ることができたが、今年はイベント開始のスケジュールが前倒しになっていた。筆者のローカルの時間では基調講演が午前1時頃に始まっていたので不便に感じたが、開催地のヨーロッパに合わせていて調整しているので正しかったと考えている。
  • 2つ目の記事のタイトルは「KubeCon EU 2021: Developers, Developers, Developers (and Control Planes)」。
    • 「クラウドにおける開発者と開発者の経験」にフォーカスして伝えている。
A post on avoiding vendor lockin by owning you data, your front-end interfaces, your source code and avoiding long term contracts.
  • タイトルは「Rule number one: Avoid vendor lock-in」。
  • 筆者の立場から、冒頭に以下のDisclaimerを記載している。
    • Extra-prominent disclaimer: Views expressed here are my own, and don’t necessarily reflect the views of the Government of Canada. Products mentioned below are examples and not endorsements.
  • 以下の項目に沿って丁寧に解説されている。具体的にやること、場面がイメージできて良い。特に「public money? Public code.」はシンプルで納得感があるメッセージ。
    • What is vendor lock-in?
    • How do you avoid vendor lock-in?
    • Own your data (and make sure you can move it somewhere new)
    • Own your front-end interfaces
    • Own your software source code
    • Avoid long-term contracts
    • What should vendors do, then?
  • 「What should vendors do, then?」の項目で、ベンダー側にもそうしたよう要求に応えるべく高い品質のサービスを提供していくこと、外部ベンダーを利用する具体例を挙げた領域、を提案していて参考になる。
A good post on the practices required to adopt continuous delivery, with examples using the Batect build system.
  • タイトルは「DevOps Practices for Continuous Deployment」。
  • 3つのDevOpsプラクティスと、Dockerコンテナーでタスクを実行するOSSのツール「Batect」を使用して、それらをどのように適用したかを解説している。
A quick overview of the metrics you should be measuring if you’re running Kubernetes clusters.
  • タイトルは「Key Kubernetes Metrics and Resources to Monitor for Peak Cluster Performance」。
  • Kubernetesのアクセス可能な主要メトリクスと、それらを理解する方法を以下の構成で詳しく解説している。
    • Kubernetes Objects
    • Kubernetes Cluster & Node Metrics
    • Kubernetes Deployments & Pod Metrics
      • Kubernetes Metrics
      • Container Metrics
      • Application Metrics
    • Monitoring Kubernetes with Sematext
    • Conclusion

Tools

vcluster creates fully functional virtual Kubernetes clusters running inside a namespace of an underlying Kubenretes cluster. It's cheaper than creating separate clusters and it offers better multi-tenancy and isolation than regular namespaces.
  • 上記の通り、Kubernetesクラスターの中で名前空間で仮想のKubernetesクラスターを提供するツール「vcluster」のWebページ。
  • GitHubページはこちら
Lima is a brand new tool for anyone on a Mac wanting to run Linux instances that come pre-configured with containerd for running containers.
  • 「Lima(Linux-on-Mac)」のGitHubページ。
eBPF on Windows. Lots of interesting things are being built on top of eBPF in the Linux kernel. The idea of eBPF implementations in other operating systems and even user space programmes is certainly interesting.
  • Microsoft Open Source Blogからの記事でタイトルは「Making eBPF work on Windows」。上記の通り、eBPFのWindows。
  • GitHubページはこちら
Do you find yourself writing bash scripts but wish you could write JavaScript instead? Zx provides some nice utilities and removes the need for users to be node or npm experts.
  • 「ZX」のGitHubページ。child_processの便利なラッパーを提供し、引数をエスケープして、適切なデフォルトを提供する。
Ahoy is a user-friendly dashboard for managing Helm-deployed applications on Kubernetes.
  • 上記の通り、Kubernetes上のユーザーフレンドリーなHelmのダッシュボード「Ahoy!」の紹介記事。
  • GitHubページはこちら

SRE Weekly Issue #270 May 16th, 2021

Articles

Thundering herds, noisy neighbours, and retry storms

This is an in-progress document about the kinds of patterns we see or use when designing systems. The author warned me that it’s a work in progress and maybe not ready for prime-time, but I think this is exactly the time when I should get it in front of your eyes.

I’d love your help growing this list. If you know of a name that is missing from the list please send me a tweet with the name and a short description of it and I’ll include it in the list with a link to your tweet

Mads Hartmann

  • 上記の通り、この記事の筆者が作成したシステムをデザインする際に見かけるパターンのリストの紹介。記事中にもあるSRE WeeklyのEditorであるLex Neva氏が提案している「operational patterns」という呼び方が良さそう。
The Downtime Project

Whoa, a podcast dedicated to picking apart public incident postings! I love this, because there’s a lot that’s left to shorthand, and a live conversation is a great way to flesh it out.

Tom Kleinpeter and Jamie Turner

  • 上記の通り、Podcastの紹介。「March 20, 2021」のIntroductionから、毎週エンジニアリングチームがOutageやポストモーテムから学んだ教訓を共有している。
Health boss unsure how many hospital patients were overdosed due to Windows upgrade

There’s a really interesting undercurrent in this story about resilience. Nurses can catch these kinds of errors, but this just one layered protection among many. If the system is reduced to relying on that second-layer defense, the overall resilience is diminished.

Daniel Keane — ABC News

  • タイトル通り、Windows 10へのアップグレードによるエラーが発生し、必要な量の10倍以上の薬を患者が受け取っている可能性がある。
Have you ever seen a car crash test? That’s Chaos Engineering

Of course, before reaching this stage, all of the pieces are tested in isolation. But until they’re all put together, it’s almost impossible to predict the behavior of the finished product during an accident.

Mikolaj Pawlikowski

  • タイトルの通り、カオスエンジニアリングの必要性を、自動車の衝突安全性能試験を引き合い出して解説している。
4 attributes of a great site reliability engineer

The attributes discussed are:

* Problem solving
* Awareness building
* Collaboration
* Empathy

Jayne Groll

  • DevOpsInstituteのアンバサダーとSREの対象分野の専門家に、「優れたSREとは?」をヒアリングし、彼らが提案した主な上記4つのattributeを解説している。
How to hire Site Reliability Engineers (SREs): 5 top qualities

Wait, more attributes? Oh, and by the same author, too:

* “Great SREs have a passion for high-quality automation.”
* “A great SRE ensures SLOs (Service Level Objectives) are set at correct boundaries of service; […]”
* Prize Communication.
* Look for longer-term support experience.
* Look for a person that demonstrates empathy.

Jayne Groll

  • 上記のEditorと全く同じ感想。一つ上の記事と同じ筆者が「優れたSREとは?」をヒアリングし、彼らが提案した主な上記5つのattributeを解説している。
  • 個人的には、この2つの記事を「何故/何を基準に、書き分けているのか?」「それぞれが繋がるように書いていないないのはなぜか?」という疑問が浮かぶ。
Site Reliability Engineering for Native Mobile Apps

This one explore the application of SRE principles to mobile app design.

Abhijith Krishnappa

  • モバイルアプリの信頼性にSREの原則を適用する方法について解説している。
Choosing SLOs that users need, not the ones you want to provide

This two-part series uses a narrative case study format to show how SLOs can be misleading. You might have great numbers, but what are the numbers actually measuring?

Adam Hammond — Squadcast

  • SLOについて、以下の問題点に対してアプローチしている。
    • A lot of IT professionals tend to think that they know the best metrics, and they do; the only problem is that they are the best metrics for monitoring systems, not for improving customer satisfaction.

Outages

  • A major US oil pipeline
    The pipeline was targeted by a ransomware attack.
  • GasBuddy
    This app for finding gasoline prices seems to have been impacted by a flood of user traffic driven by the US oil pipeline outage. In fact, their front page seems to be very slow for me as I write this.
  • Salesforce
    The outage was widespread and even affected their status page.
  • eBay
  • Microsoft Outlook

上記各社の障害情報


KubeWeekly #262 May 21st, 2021

The Headlines

Editor’s pick of the highlights from the past week.

Deadline approaching: KubeCon + CloudNativeCon North America 2021 CFP closes on May 23!

KubeCon + CloudNativeCon North America 2021 is happening October 12-15 in Los Angeles, CA along with a virtual experience for those who can’t travel!

Are you ready to see your name in lights and potentially have the opportunity to speak on a real stage again? Apply to speak now - the Call for Proposals (CFP) is open until Sunday, May 23, 11:59 PM Pacific Daylight Time. Since the event will be a hybrid experience, you can submit to speak either in person or virtually.

Is this your first time submitting? Check out our submission guidelines to make your proposal shine.

  • KubeCon + CloudNativeCon North America 2021のCDF締切のリマインダーと、CFPの提出方法などの案内ですね。
Take the CNCF Cloud Native Survey - Part 1

We want to hear from you! Be sure to take the Cloud Native Survey - Part 1 to share your thoughts on cloud, containers, and Kubernetes. We have a full conference pass for KubeCon + CloudNativeCon Europe 2022 to give away – complete the survey by June 15 for a chance to win!

  • 上記の通りサーベイを行っており、回答すると「KubeCon + CloudNativeCon Europe 2022」 のパスがもらえる模様。回答が終わると、名前/会社名/メールアドレスの入力が求められます。後日、パスが贈呈されるはず。

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Where to begin your dev-centric cloud infosec journey

Guy Eisenkot & Ashley Ward, Palo Alto Networks

  • 中断を最小限に抑え、生産性を最大化するために、クラウド上でinfosec journey=どこから始めればよいか、既存のプロセスにセキュリティーをどう組み込むか解説している。
Kubernetes 1.21 Release

Nabarun Pal & Anna Jung, Kubernetes 1.21 Release Team

  • Kubernetes 1.21のリリースに合わせて、リリースチームリードとenhancementリードによるリリースウェビナー。1.22からリリースサイクルが年4から年3回に変更されることを冒頭に確認。
Leveling Up Kubernetes with kube-vip

Dan Finneran, Equinix Metal

  • Kubernetesクラスターの内外でHAと負荷分散をために「kube-vip」を開発した理由を案内し、その仕組みをデモで解説している。


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Journey of a Cloud SQL Packet

Damian Peckett, kloeckner.i

  • Cloud SQLについて簡単に説明し、次にkloeckner.i社での使用方法と、管理オーバーヘッドの少ないワークフローのために構築したツールを紹介している。
How to create a Ubuntu Packer Image and deploy on a Bare Metal Server

Chitrabasu Khare, InfraCloud

  • Packerを使用して最小限の生のUbuntuイメージを作成し、プロビジョニングエンジンである「Tinkerbell」を使用してベアメタルサーバーにデプロイする方法を解説している。
Workload mobility in a service mesh world

Cody De Arkland, Kong

  • 「ゼロトラストセキュリティ」の側面に大きな焦点が当てられきたことに触れ、「サービスメッシュにとって、ゼロトラスト次の章は何か?」をテーマに以下の構成で解説している。
    • Same Problem, Different Data Center
    • Creating Environment Consistency
    • Progressive Delivery, Migration and Controlling Flow
    • The Next Generation of Service Mesh
Key Kubernetes metrics to monitor for peak cluster performance

Adnan Rahic, Sematext

  • 上記のDEVOPS WEEKLY ISSUE #542で取り上げているので、割愛。
Learn how to build functions faster using Rancher's kim and K3s

OpenFaaS Ltd.

  • コンテナイメージをノードのイメージライブラリに直接構築できる、RancherLabs社による新しいプロジェクトである「kim(The Kubernetes Image Manager)」のテスト方法を中心に解説している。
Autoscaling Kubernetes clusters

Puja Abbassi, Giant Swarm

  • 「Cluster Autoscaler」に焦点を当ててタイトルに沿って以下の構成で解説している。
    • Cluster Autoscaler
    • Cloud Providers
    • Scaling Up
    • Scaling Down
    • Scaling Latency
    • All the Autoscalers
    • Spot Instances
    • Conclusion
AWS Secrets Manager on Kubernetes using AWS Secrets CSI driver Provider

Theo “Bob” Massard, Particule

  • AWS Secret Store Providerのテストをフォローアップし、AWS Secrets Managerとアプリの環境の間のブリッジとしてそれを使用する方法を解説している。
Kube-Prometheus – A complete monitoring stack using Jsonnet

Lennart Jern, Elastisys

  • kube-prometheus」を使用してアプリを正確に監視を実現する方法を解説している。
The easiest way to debug Kubernetes workloads

Martin Heinz

  • タイトルの内容を以下の構成で検討、解説している。
    • There Might Just Be a Better Way...
    • Configuring Feature Gates
    • Process Namespace Sharing
    • Putting It To Good Use
    • Bonus: Debugging Cluster Nodes
    • Conclusion
Kubernetes capacity planning: How to rightsize your cluster

Jesus Ángel Samitier, Sysdig

  • 未使用のリソースを特定する方法と、クラスターの容量を適切に設定する方法を解説している。
Learn how Istio can provide a service mesh for your functions

Alex Ellis, OpenFaaS Blog

  • IstioとOpenFaaSの統合を開始できるように簡単な紹介から入り、クラスターのリソース消費量を測定する方法と、Istio GatewayのTLS証明書を作成する方法を解説している。
GitOps Guide to the Galaxy (E15): Introducing the App of Apps and ApplicationSets

Christian Hernandez, Chris Short, Red Hat

  • 「App of Apps」の概念と、GitOpsに存在する課題に対してその課題をどのように軽減できるかを解説している。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Pixie, with Zain Asgar and Ishan Mukherjee

Craig Box, Kubernetes Podcast from Google

It’s Been a Full Year Since we Launched OpenShift TV

Chris Morgan, Red Hat

  • タイトルと記事では「OpenShift TV」を始めて1年が経過したことを解説。動画は「Playing with Prometheus」をテーマにした2時間超のセッション。
The need for new DevSecOps tool arises as infrastructure drift proves to be a multidimensional problem

CloudSkiff

  • OSSのCLIツールである「driftctl」を必要となった背景から紹介している。
Ahoy! (new project post)

Yoko Kawamoto

  • 上記のDEVOPS WEEKLY ISSUE #542でも取り上げている「Ahoy!」の別の紹介記事。こちらは文字情報よりも画像が多く、視覚的に内容を見ていくのに良い。
Kubernetes, (Almost) Love at First Sight with Chris Ferreira

Committing to Cloud Native Podcast

  • 2021/05/23 23:21(JST)現在、該当のURLに「DNS_PROBE_FINISHED_NXDOMAIN」エラーが出てアクセスできない。昨日の時点ではアクセスできたのだが。。。後でチェックする。
    • 2021/05/29 10:48(JST)に確認したら、繋がるようになっていました。
ICYMI: CNCF YouTube Channel featuring all talks from KubeCon EU 2021are now available!
  • KubeCon EU 2021の公開されているセッション動画のプレイリスト。全然見れていないので、キャッチアップしたい。

Upcoming CNCF Online Programs

Live webinar
Cloud Native Live
On-demand
YouTube playlist submissions

Learn more about CNCF Online Programs


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara