運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#33(9/13~9/18)

この記事は2020/9/13~9/18に発行された下記3つのWeekly Reportを読み、備忘録兼リンク集として残したものです。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #507 September 13th, 2020
SRE Weekly Issue #235 September 13th, 2020
KubeWeekly #233 September 18th, 2020

English Version of this blow is here.

  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2019年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #507 September 13th, 2020

env0 sponsors Devops Weekly

Setting up a CD pipeline in 5 minutes? It's actually doable these day with off the shelf tools. Check out how

About env0: use Terraform to let your team manage their own environments in AWS, Azure and Google. Governed by your policies and with complete visibility & cost management.

  • タイトルは「Making Continuous Deployment of Terraform code easier with env0」。
  • 「CDパイプラインの設定は複雑に見えるかもしないが、新世代のツールを使用すると、実際にははるかに簡単になる」 として、env0を使用して簡単なCDパイプラインの設定方法を示している。
  • 自身で試すのに必要なものは以下3つ。
    • An env0 account (It’s free! Just join here)
    • A GitHub account
    • An AWS account

News

A post on how to build an SRE team, from other roles to find candidates in to how you might choose to structure the team to begin with.
  • タイトルは「How to Build Your SRE Team」。
  • 先週のSRE Weekly Issue #234で取り上げているので、割愛します。
A new podcast series focused on chaos engineering, with several discussions already on the psychology of chaos engineering and learning from incidents.
  • カオスエンジニアリングの実務者のコミュニティー「Chaos Community」が主催している新しいPodcastシリーズ。
  • 既にEpisode 3まで公開されており、ゲストにNora Jones氏、Russ Miles氏、Julie Gunderson氏を迎えている。
An introduction to the operator pattern in Kubernetes, and a look at the Operator Framework SDK for creating Go operators.
  • タイトルは「Kubernetes Operators 101」。
  • Kubernetes Operatorとは何か、それらが2つの基本的で強力な部分であるKubernetesカスタムリソースとコントローラーからどのように構成されているか解説している。
A good list of best practices for building Docker images for Node.js projects. While some are generally applicable, several are specific to Node.
  • タイトルは「Docker best practices with Node.js」。
  • Node.jsの領域でDockerベストプラクティスを例示している包括的なリスト。
  • 各箇条書きには、詳細情報とコード例へのリンクあり。 リスト全体は、「Node.js Best Practices」にある。
A discussion of the importance of flow, and approaches to building empowered teams that can deliver products end-to-end.
  • タイトルは「Product Teams Need a Family Too! @ New Ways of Working - Modern Agile in Wellington meetup, Sep 2020」。
  • SlideShare上に公開されている上記イベントでの講演スライド。「Team Topologies」の2名の共同著者が本のエッセンスを引用しながら講演を行なっている。
An interesting community attempt to standardize how to distribute WASM applications as OCI images. I’d like to see this conversation happen under the auspices of the OCI but interesting stuff.
  • タイトルは「Announcing the WebAssembly (wasm) OCI Image Spec」。
  • Solo.io社による「WebAssembly(Wasm) OCI Image Specification」の紹介記事。

Tools

An online GUI tool for quickly creating Kubernetes YAML configuration files. Select the workload type and then go through the (long) list of available options.
  • 先週のKubeWeekly #232で取り上げているので割愛します。教育的なUIで、個人的にとてもオススメのツールなので、ご確認あれ。
Whispers is a new tool for identifying secrets (AWS tokens, hashed credentials, sensitive files, etc.) in source code and various configuration files.
  • ハードコードされたクレデンシャル情報と危険な関数を検索するため、さまざまな一般的なデータ形式を解析する静的コード分析ツール「Whispers」のGitHubページ。
  • CLIでの実行、CI/CDパイプラインへの統合が可能。
Polaris is an interesting looking audit tool for Kubernetes, showing a high-level health score for clusters and workloads and providing a list of issues to fix.
  • Fairwinds社が開発したKubernetesデプロイメントの構成エラーを識別するオープンソースプロジェクト「Polaris」のGitHubページ。
  • Kubernetesポッドとコントローラーがベストプラクティスを使用して構成されていることを確認し、将来の問題を回避可能にする。
  • 以下3つの異なるモードで実行可能。

SRE Weekly Issue #235 September 13th, 2020

Articles

Alerting on SLOs

This isn’t just another boring article about SLOs. There’s a ton of good stuff in here about why they moved to SLO-based alerts, too.

we’re hoping that by implementing SLOs – and alerting on them – we’ll be able to improve communication during incidents, reduce the toil on on-callers, and help improve our reliability in a way that’s meaningful to our users.

Mads Hartmann

  • Glitch社がSLOベースのアラートに移行したプロジェクトに関する記事。
  • 2つの内部ドキュメントをベースにしている。
    • 1つ目は、当事者にとって適切なアプローチであるかどうかを議論するために使用した技術仕様
    • 2つ目は、筆者がプラットフォームチームにSLOベースのアラートを紹介したプレゼンテーション
  • TL;DRがそれなりにボリュームある。
A nudge in the right direction

Often, serendipity gets us out of an incident or makes it less severe.

Unless we treat this sort of activity as first class when looking at incidents, we won’t really understand how it can be that some incidents get resolved so quickly and some take much longer.

Lorin Hochstein

  • 筆者が運用の中で「サプライズ」に出会い、自発的に横連携して行われている軌道修正と、その大切さを語っている記事。
  • Slackを使った知見の共有などを具体例を短く書いている。
Seamlessly Swapping the API backend of the Netflix Android app

It’s your classic “replace the engines on a jet while flying it” story. My favorite part is how they recorded real traffic and played it at the old and new backend API to compare the JSON responses.

Rohan Dhruva and Ed Ballot — Netflix

  • Netflix社のAndroidチームによる最近完了した1年にわたる移行プロジェクトに関する記事。
  • 集中型モデルからバックエンドを再設計および分離した。この移行へのアプローチ、採用した戦略、およびこれをサポートするために構築したツールについて説明している。
  • 複数のバックエンドチームとフロントエンドチームの共同の取り組みであり、読み応えがある。
Using feature flags during incident management

Feature flags can help with load shedding and throttling, and feature flag activity can even be useful data that points to contributing factors.

Dawn Parzych — LaunchDarkly

  • インシデントの定義から確認し、インシデントに対応している人間への影響、インシデント解決の課題を取り上げ、以下5つのポイントに沿ってFeatureフラグを使ったインシデント管理を改善させる方法を解説している。
    1. Kill switches or circuit breakers
    2. Throttling
    3. Reducing MTTR
    4. Automation
    5. Update your processes and runbooks
Unimog – Cloudflare’s edge load balancer

Unimog uses a lot of really interesting techniques to balance layer 4 traffic, about which this article goes into in great detail.

David Wragg — Cloudflare

  • Cloudflare社のL4ロードバランサー「Unimog」の解説記事。
  • 約2年前に、データセンター内の負荷を分散するための既存のソリューションではニーズを満たせなくなることに気付き、Unimogをデプロイするプロジェクトに着手した。Unimogは1年以上本番環境にデプロイされている。
  • Unimogは他のL4ロードバランサーで使用されている手法に基づいてるが、エッジネットワークのニーズに合わせて調整された実装の詳細が数多くある。そして、この記事が力作なので、サッと読めず。連休中に読み返します。
Production testing with dark canaries

I like this idea: it’s like a normal canary, except that you only send it a copy of traffic and discard the result, so as to avoid impacting users.

David Hoa — LinkedIn

  • 本番環境に移行する前に問題を検出する方法として、「ダークカナリアクラスター(dark canary clusters)」を紹介している。

Outages

上記各社の障害情報

KubeWeekly #233 September 18th

The Headlines

Editor’s pick of the highlights from the past week.

TiKV, TiDB and PingCAP, with Ed Huang

Congratulations to the TiKV team for graduating in the CNCF. How much do you know about this key-value store, and the TiDB SQL layer built atop it? Learn about its history in this Kubernetes Podcast from Google interview with PingCAP co-founder Ed Huang.

  • Google社社員によるKubernetes Podcast。現在のCo-hostはCraig Box氏とAdam Glick氏。
  • PingCAP社のco-founderおよびCTO、そしてTiDB分散データベースとTiKV KVSのcreatorであるEd Huang氏をゲストとして迎えている。
  • News of the weekで気になったトピックは以下の通り。この記事の他の場所や既知のものがあったので、ここで言及していませんが気になるニュースが多かったです。
TOC approves KubeEdge as incubating project

KubeEdge is an open source system for extending containerized application orchestration capabilities to hosts at the edge. It is built on top of Kubernetes and provides infrastructure support for network, application deployment, and metadata synchronization between the cloud and the edge. This brings the current number of incubating projects to 21.

  • CNCFによる、KubeEdgeがIncubatingプロジェクトとしてCNCF TOC(Technical Oversight Committee)が承認したことを伝える記事。
  • KubeEdgeは2019年3月にCNCF Sandbox project入りし、version 1.0 を2019年6月にリリース。KubeEdgeチームは4半期に1度、アップストリームのKubernetesに合わせて新しいバージョンをリリースしている。

ICYMI: CNCF Webinars

You can view all CNCF recorded and upcoming webinars here.

CNCF Member Webinar: Declaratively managing apps in a multi-cluster world

Fernando Ripoll, Solution Engineer @Giant Swarm

  • オープンソースツールのapp-operator(およびその兄弟分のchart-operator)について説明している。これらはHelmを基盤としており、クラスターチームでアプリを管理するための宣言的な方法をプラットフォームチームに提供する。
  • 単純なCRDの形での抽象化が理にかなっている理由と、それをさまざまなユースケースに使用できる方法について説明している。
CNCF Member Webinar: Effective Kubernetes onboarding

Jamon Camisso, Developer Educator, Community @DigitalOcean

  • テーマに沿って、以下2点を解説している。DO=DigitalOcean。
    1. Core concepts and insights from DO’s new Kubernetes for Full-Stack Developers curriculum
    2. An on-the-ground perspective taken from the Community Platform team’s migration from a traditional VM environment to Kubernetes.
  • 重要なポイントとして、以下2点を挙げている。
    1. How to onboard teams successfully by establishing knowledge baselines and effectively organizing, structuring, and delivering Kubernetes concepts
    2. How to situate Kubernetes in a larger arc of application development and integrate it into an existing development workflow
CNCF Member Webinar: How to run Kubernetes securely and efficiently

Joe Pelletier, VP, Products Fairwinds @Fairwinds & Robert Brennan, Director, Open Source @Fairwinds

  • Kubernetesを安全かつ効率的に大規模に実行する方法について解説している。 また、エンジニアリングリーダーがKubernetesでうまく使用して、アプリケーションの信頼性、セキュリティ、スケーラビリティを向上させるオープンソースツールについても説明している。
CNCF Ambassador Webinar: Hybrid serverless development using Quarkus and Kubernetes

Daniel Oh, Principal Technical Marketing Manager @RedHat and CNCF Ambassador

  • Quarkus、Kubnertes Native Java Stackを使用して、開発者が従来のマイクロサービスを作成し、複数のサーバーレスプラットフォーム(Knative + Kubernetes、Amazon Lambdaなど)に機能をデプロイできるようにする方法を解説している。
CNCF Member Webinar: Achieving least privilege access in Kubernetes

Eran Leib, Co-Founder and VP Product Management @Apolicy & Daniel Pacak, Open Source Engineer @Aqua Security

  • Kubernetesの動的な環境でセキュリティーとコンプライアンスの課題に取り組む専門家からのよくある以下のような質問に回答している。
    • What is RBAC?
    • How access in Kubernetes works?
    • How to define and enforce access policies?
    • Can roles only be assigned the access level needed to do their job?

The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

5 tips for developing Kubernetes operators with the new Operator SDK

Laurent Broudoux, Red Hat

  • 新しくリリースされたKubernetes Operator SDK 1.0.0を使用したOperatorの開発を楽にする以下5つのTipsを中心に紹介している。
    1. Handling default CRD values
    2. Preparing your Operator for OpenShift
    3. Discovering the cluster you’re running on
    4. Using extensions APIs in Go-based Operators
    5. Adjusting Operator resource consumption
Let’s learn Kubermatic Kubernetes Platform

Saiyam Pathak, Civo

  • Kubermatic Kubernetes Platformとその概念をスライドと、以下のデモで詳しく説明している。
    • Demo 1 - Dashboard overview and Kubernetes cluster on Google cloud
    • Demo 2 - Kubernetes cluster install on AWS via KKP
    • Demo 3 - Cluster Upgrade via KKP
    • Demo 4 - Resource on KKP platform and some dashboards
Terrascan extends policy as code to Kubernetes

Jon Jarboe, Accurics

  • インフラのコンプライアンス、セキュリティー違反を検出するOSSツールの「Terrascan」がバージョン1.1.0でKubernetesのサポートしていることを伝えている記事。
  • Terrescanは、チームがインフラ全体のコンプライアンスおよびセキュリティー違反をコードとして検出し、クラウドネイティブインフラをプロビジョニングする前にリスクを軽減できる拡張可能なツール。
  • 今後のリリースでは、Terraformなどの他のIaCプロバイダーを通じて管理されるk8sインフラストラクチャのサポートが追加される予定。
An introduction to Kubespray

Shiwani Biradar, Enable Sysadmin

  • Kubernetesクラスターをデプロイするツール「Kubespray」を紹介している記事。
  • kubesprayについて説明する前に、その機能と特徴を含め、Kubernetesについて少し紹介している。
Cruster: Easily create and manage Kubernetes clusters on Raspberry Pis

Zane Hitchcox

  • Raspberry Piをキーボード/モニターに接続せずに、KubernetesのクラスターをRaspberry Pi上に作成できるツール「Cruster」のioページ。約4分のデモ動画あり。
Easier troubleshooting of cert-manager certificates

Haoxiang Zhou, Jetstack

  • cert-managerに関するkubectlプラグインの最新の追加機能であるkubectl cert-manager status certificateコマンドについて説明している。
  • このコマンドはcert-managerの問題のトラブルシューティングを容易にするために設計されており、最近のv1リリースで大幅に改善された。
High-availability PostgreSQL and more on OpenShift

Jonathan Katz, Crunchy Data and Diane Mueller, Red Hat

  • Red Hat社のOpenShiftチームによるWebinar動画。ゲストスピーカーとして、Jonathan Katz(VP Platform Engineering at Crunchy Data)氏を迎えてテーマに関する説明を行なっている。
Performing a live CNI migration

Josh Van Leeuwen Jetstack

  • CNIを変更する理由、ライブマイグレーションのソリューションの開発で学んだこと、およびすべてがどのように機能するかについて説明している。
pgnodemx

pgnodemx provides a set of functions facilitating the collection of host-node level operational metrics. In particular, pgnodemx has support for capturing metrics related to cgroups (one of the Linux kernel facilities underlying the various Container technologies) and the Kubernetes Downward API.

  • GitHub上のCrunchyData社の「pgnodemx」公開リポジトリ。
  • 「pgnodemx」は、SQLクエリを介してノードOSメトリックをキャプチャできるSQL関数を提供する、PostgreSQLの拡張機能。

The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Managed Kubernetes services compared: GKE vs. EKS vs. AKS

Bharat Arimilli

  • 筆者の観点に沿って、Amazon Elastic Kubernetes Service(EKS)、Google Kubernetes Engine(GKE)、Azure Kubernetes Service(AKS)を見て、それらの機能と全体的なエクスペリエンスを比較している。
  • 以下の注意で筆者が述べているように、既に情報が古くなっている可能性があります。また、比較している観点や、技術を選択する事情はそれぞれ異なるので、こうした記事はあくまで一つの参考として批判的な目で見るのが良いと思います。内容に明確な誤りや偏りがある場合は、筆者に直接フィードバックしてあげると良いと思います。
    • Note: These services tend to evolve very quickly, so some of these details may be outdated by the time you read them.
Tech Breakfast Podcast, with Chris Short

Aaron Buley and Tyler Gates

  • Podcast、「Tech Breakfast Podcast」にKubeWeeklyの編集者であるChris Short氏がゲストとして参加している回。Kubernetesのリリースチーム、NVIDIA社によるArm社の買収などについて語っている。
Must-read free Kubernetes books

Bilgin Ibryam, Red Hat

  • 無料で提供されているKubernetes関連の必読書を紹介している記事。この内容を無料開放しているのは素晴らしい。あとはそれぞれの必要と時を作り、読むだけだ。。。
Crossplane: A Kubernetes control plane to roll your own PaaS

Joab Jackson, The New Stack

  • Upbound社のPhil Prasek(principal product manager)氏をゲストに迎えているPodcast「The New Stack Context」の紹介記事。ページにPodcastが埋め込まれている。
Confidential GKE nodes now in beta

Sunil Potti and Eyal Manor, Google Cloud

  • Google Cloud Confidential Computing portfolioを拡大し、以下2つの発表によって同社のビジョンを発表している記事。
    • First, Confidential GKE Nodes, the second product in our confidential computing portfolio, will soon be available in beta, starting with the GKE 1.18 release. This gives organizations additional options for confidential workloads when they want to utilize Kubernetes clusters with Google Kubernetes Engine (GKE).
    • We’re also making Confidential VMs generally available. This capability will be available to all Google Cloud customers in the coming weeks and will include new features we’ve added during beta.
  • 「Confidential Computing」を紹介する熱量の高い動画が埋め込まれている。
Achieving multi-tenancy in monitoring with Prometheus & the mighty Thanos Receiver

Sayan Das, InfraCloud

  • Thanosのコンポーネントとして、これまでEXPERIMENTALのステータスであった「Receiver」がGAになったことをタイトルに沿って紹介している。
  • Thanos Receiverは、分散監視の一般的な課題の1つであるマルチテナントの実装のために設計されたコンポーネント。
  • 次の記事では、このアーキテクチャーを改善して、thanos-querierにテナントの分離を実施する模様。

Upcoming CNCF webinars

気になるWebinarがあれば登録してチェックを。以下は直近のものとしてリストされていたものです。

Member Webinar: Using KubeVirt in telcos
Abhinivesh Jain, Distinguished Member of Technical Staff @Wipro
Sept 23, 2020 7:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Mitigating Kubernetes attacks
Wei Lien Dang, Head of Strategy @StackRox
Sept 23, 2020 1:00 PM Pacific Time
REGISTER NOW »

Member Webinar: AWS controllers for Kubernetes – AWS services, now Kubified!
Jay Pipes, Principal Open Source Engineer @Amazon Web Services
Sept 24, 2020 10:00 AM Pacific Time
REGISTER NOW »

Project Webinar: Kubernetes 1.19
Kubernetes Release Team
Sept 25, 2020 8:00 AM Pacific Time
REGISTER NOW »

Ambassador Webinar: The evolution of Ingress through the Gateway API
Kaslin Fields, Developer Advocate @Google
Bowei Du
Sept 25, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: VanillaStack as a platform for a truly vendor-agnostic open-source ecosystem
Karsten Samaschke, CEO @Cloudical
Sept 29, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Self service Kubernetes for enterprises
Jim Bugwadia, Founder and CEO @Nirmata
Sept 30, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Dapr, Lego for microservices
Mark Chmarny, Principal Program Manager @Microsoft
Oct 1, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Transactional microservices – The final frontier
Daniel Kozlowski, Minister of Engineering @PlanetScale
Oct 2, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Multi-Cluster & multi-cloud service mesh with CNCF’s Kuma and Envoy
Marco Palladino, CTO & Co-Founder @Kong
Oct 6, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: The evolution of cloud orchestration systems from ephemeral to persistent storage
Boyan Krosnov, CPO @StorPool
Oct 7, 2020 8:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Kubernetes native two-level resource management for AI/ML workloads
Diana Arroyo Software Engineer @IBM Research
Alaa Youssef, Manager, Container Cloud Platform @IBM Research
Oct 7, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Building dynamic machine learning pipelines with KubeDirector
Tom Phelan, Fellow, Software Organization @Hewlett Packard Enterprise
Oct 8, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: ephemeral.run: A full application environment for every PR–before you merge to master!
Vishal Biyani, CTO @InfraCloud
Jono Spiro, Staff Software Engineer, Engineering Operations @OpenGov
Oct 14, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Building 12 factor streaming data apps on Kubernetes
Stelios Charmpalis, Frontend Engineer @Lenses.io
Francisco Perez, Senior Backend Engineer @Lenses.io
Oct 14, 2020 1:00 PM Pacific Time
REGISTER NOW »

いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara