運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#86(2021/9/19~9/24)

The English Version of this blog is here.

この記事は2021/9/19~9/24発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #560 September 19th, 2021
SRE Weekly Issue #288 September 19th, 2021
KubeWeekly #278 September 24th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #560 September 19th, 2021

News

An interesting post discussing some of the edges of Terraform if you use it for cloud, Kubernetes and other resources using the same state.
  • タイトルは「Terraform is Not the Golden Hammer」。
  • Terraformをどこで、いつ、どのように使用すべきかを説明する、自社の経験を振り返った記事。以下のポイントで解説している。
    • How we used Terraform
    • Problems facing
    • Advises and suggestion
    • Conclusion
A post positing using SQL as the interface for cloud infrastructure. Some interesting ideas about a familiar interface and existing tooling.
  • タイトルは「Infrastructure as SQL」。
  • タイトルと上記のEditorのコメントを以下のポイントで解説している。
    • Relations and Types Matter for Infrastructure
    • New Powers: Explore, Query, and Automate Your Infrastructure
    • You Don't Need to Learn a New API (Probably)
    • You Can Test, Too
    • Recover With Ease
A discussion of the role of SREs in enabling true self service platforms and empowering developers.
  • タイトルは「The Developer Experience and the Role of the SRE Are Changing, Here's How」。
  • Conclusionの中で筆者が伝えたい内容「Developers should take the opportunity to share their pain points and also learn about tooling and best practices from SRE teams, with the goal of “paving the path” to developer autonomy, self-service, and full service ownership.」を以下のポイントで解説している。
    • Two worlds colliding: The monolith and service-oriented architecture
    • Enabling developers to own the full application lifecycle
    • Understand the changing developer experience to support developer ownership
    • Conclusion: Developers should work with SREs as collaborators, not first responders
The start of a series on API design, based around gRPC. The first post focused specifically on using Protobuf FieldMask.
  • タイトルは「Practical API Design at Netflix, Part 1: Using Protobuf FieldMask」。
  • シリーズ投稿のPart 1。データを読み取るAPI用にNetflix Studio Engineeringで使用される方法と理由を解説している。
  • Part 2では、更新および削除操作にFieldMaskを使用する方法を解説するとのこと。
Another post on configuration management, focused on applying gitops practices with some good examples up to applying this approach to a multi-cluster federated service mesh setup.
  • タイトルは「Configuration as Data, GitOps, and Controllers: it’s not simple for multi-cluster」。
  • タイトルの内容を以下のポイントで手書き感のある図などを用いながら解説している。
    • A basic example of declarative configuration and controllers
    • Extreme examples
    • Case study: multi-cluster GitOps with Istio
    • Federating a service mesh has unique challenges
    • Takeaways
A deep dive into Kubernetes ingress, with helpful diagrams showing how things work.
  • 上記の通り「Kubernetes Ingress」にdeep diveをして解説している。

Tools

Kim, or Kubernetes Image Manager, provides the classic Docker build, pull, push interface with the build infrastructure deployed to Kubernetes.
  • Kubernetes対応のCLIである「kim(Kubernetes Image Manager)」のGitHubページ。k3sクラスター上でネイティブにイメージをローカルに構築できる。
  • 「STATUS: EXPERIMENT - Let us know what you think」の記載がある通り、まだ実験段階。
Kubernetes is often described as a platform for building platforms. Kratix describes itself as a framework for delivering that platform, bring conventions and tools to something lots of organisations hand roll today.
  • プラットフォームを提供するためのフレームワークである「Kratix」のGitHubページ。
If you’ve been following this newsletter, you’ll know eBPF is powerful, but we’re only just starting to see use cases. BMC Cache is an in-kernel cache for memcached that claims to improve throughput by up to 18x.
  • memcachedのカーネル内キャッシュである「BMC (BPF Memory Cache) 」のGitHubページ。
KinK is a CLI that helps you manage KinD clusters as Kubernetes pods. Designed to ease standing up clusters for fast testing.
  • KubernetesのPodでのKinDクラスターの実行を容易にし、クラスターの一覧表示や削除など、これらのクラスターのライフサイクル全体を管理するCLIアプリ「kink」のGitHubページ。

SRE Weekly Issue #288 September 19th, 2021

Articles

Tammy Bryant Butow on SRE Apprentices

Faced with a difficult hiring market for SREs, they embarked on a well-designed, carefully thought out program to hire and train entry-level folks as SREs — and it worked!

Thomas Betts — InfoQ

  • 新任のSREのトレーニングをテーマにディスカッションしている。
  • Key Takeawaysは以下。
    • Hiring new site reliability engineers can be challenging. Dropbox decided to create a program to teach a cohort of students the skills necessary to be successful SREs.
    • A non-traditional approach to find engineers will naturally lead to a more diverse set of applicants. Bringing in people with different backgrounds can lead to new ways of looking at common problems.
    • Training should start with small tasks, letting the engineer learn by doing. Gradually these build from one-day tasks to longer, one-week, or one-month projects.
    • If your company creates a formal training program, it needs to be communicated to everyone, so there is understanding and proper expectations when the apprentices work with other employees.
    • In any new role, there is a need for understanding how to communicate with other people. Inviting junior employees to meetings allows them to see how senior members of the team interact to solve problems.
The things we find hardest in incident response

No matter how good your tooling is, how experienced you are, or how much you’ve prepared, incidents can still be hard.

Five people share about what they find hardest during incident response.

Chris Evans — incident.io

  • タイトルの内容に沿って5名がそれぞれ以下のポイントでコメントを寄せている。それぞれのキーワードが強調して表示されている。
    • Working out the most highly leveraged role to play
    • Getting up to speed without disrupting the flow
    • Making decisions quickly as an individual vs context sharing and consensus
    • Keeping track of threads (virtual, not Slack)
    • Striking a balance between trusting your gut and systematically gathering evidence
    • Recovering from bad assumptions
The Developer Experience and the Role of the SRE Are Changing, Here’s How

This one has a lot of ideas about how to guide developers toward full ownership of their services in production.

Ambassador

  • 上記DEVOPS WEEKLY ISSUE #559で取り上げているため、割愛。
6 modes of system resilience

In this post, I will cover the following modes of system resilience:
* Adaptive Response
* Superior Monitoring
* Coordinated Resilience
* Heterogenous Systems
* Dynamic Repositioning
* Requisite Availability

Ash P — Cruform

  • 冒頭でsystem resilienceの定義を確認し、上記6つのモデルを解説している。
Useful knowledge and improvisation

Root cause of success: unpatched security vulnerability

TMW a security vulnerability allows you to break into your infrastructure, averting disaster during an incident.

Lorin Hochstein, with incident story by Eric Dobbs

  • インシデント対応において重要な役割を担うタイトルにある2つの要素について考察している。
Heroku Incident #2347 Follow-Up

A migration didn’t go as planned, and customer traffic lost its way.

Heroku

  • 2021-08-24 00:00 UTCから2021-08-26 19:10 UTCに掛けて発生した上記Heroku社のインシデントのフォローアップ情報。
Transforming DevOps with Human-in-the-Loop Automation

I’m a big believer in human-in-the-loop automation. My favorite part of this article was this:

A further problem is that full automation — which aims to take the human out of the picture — requires a complete, nuanced understanding of a system and all potential outcomes, paradoxically resulting in heightened system complexity.

Tina Huang — Transposit

  • タイトルの観点で以下のポイントで解説している。
    • Debunking the myth of 'automate everything'
    • Keeping humans in the loop is critical for effective automation
    • Human-in-the-loop automation in action

Outages

上記各社の障害情報。


KubeWeekly #278 September 24th, 2021

The Headlines

Editor’s pick of the highlights from the past week.

What to expect from KubeCon + CloudNativeCon North America 2021

Adrian Bridgwater, Computer Weekly

Adrian Bridgwater of Computer Weekly outlines what to expect from KubeCon + CloudNativeCon North America 2021 happening October 11-15 in Los Angeles or virtually from anywhere in the world. Learn more about the 200+ sessions, 17 co-located events, and activities. Hope to see you there!

  • KubeCon + CloudNativeCon North America 2021に向けた紹介記事。

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Introduction to APIClarity – A Wireshark for APIs

Zohar Kaufman & Alexei Kravtsov, Cisco

  • Wiresharkとして機能する新しいオープンソースツールである「APIClarity」を解説している約42分間のセッション。
  • WebinarのアジェンダとKey Discussion Pointsは以下。
    1. Understanding the need for, and benefits of, open API specification reconstruction
    2. A survey of existing open source solutions for open API specification reconstruction
    3. An APIClarity demo
    4. Potential use cases of APIClarity for API security
Optimizing and securing Kubernetes workloads with Polaris and Goldilocks

Andy Suderman, Fairwinds

  • オープンソースツールの「Polaris」と「Goldilocks」を使用して、Kubernetesワークロードをスキャンしてリソースの使用率とセキュリティーを向上させる方法を解説している約55分間のセッション。
Kong Ingress Controller - Kubernetes Ingress on steroids

Viktor Gamov, Kong

  • セキュリティーを宣言的に有効にする方法、APIレート制限、ネイティブgRPCサポートを追加する方法などを解説している約45分間のセッション。
Enable stateful applications on AWS with persistent storage for Kubernetes

Ananth Vaidyanathan, AWS

  • Amazon EFSサーバーレスストレージを使用してK8sクラスター間でデータを共有および永続化するためのさまざまなユースケース、アーキテクチャー手法、およびベストプラクティスを解説している約25分間のセッション。
Operationalizing 300+ K8 clusters across the cloud

Niraj Amin, Rajarajan Pudupatti SJ, & David Botelho, Fidelity

  • プラットフォームチームが旅の途中で直面したさまざまな課題と、それらの課題を解決するために採用されたアプローチを解説している約1時間のセッション。


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

IAM roles for Kubernetes service accounts - deep dive

Maciej Jarosiewicz

  • IAMとKubernetesが調和して連携し、ポッドからAWSサービスを簡単に呼び出すことができる優れたエクスペリエンスを提供するための要点を以下のポイントで解説している。
    • Introduction
    • IAM doesn’t trust service accounts, do you?
    • Let’s jot it down
    • Issues on top of issues
    • Federated identities
    • Swap That Swiftly
    • Making this work in your cluster
    • OIDC Identity Provider setup
    • IAM role setup
    • Off the hook
    • Summing up
StackRox office hours (E3): Kubernetes network policies

Mandar Darwatkar and Chris Short, Red Hat

  • Kubernetesを保護するための簡単で実用的な手順から始め、次にライブの質問に答えている約65分間のセッション。
KubeMQ is now available under open source license

KubeMQ

  • 「KubeMQ」のコミュニティバージョンがオープンソースプロジェクトとして利用可能になったことを紹介しているKubeMQのWebページ。
  • コミュニティバージョンは、すべてのメッセージングパターン、コネクタ、ブリッジをサポートし、どこにでもデプロイでき、本番環境で実行できる。Githubページはこちら
APM with Prometheus and Grafana on Kubernetes Ingress

Joseph Caudle, Kong

  • オープンソースの「Kong Ingress Controller」を使用してKubernetes環境を運用することで、一見困難なタスクである「完全なapplication performance monitoring(APM) stackのデプロイ」をどのように簡素化できるかを解説している。
  • 約15分間のYouTube動画も埋め込まれている。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

New Google cloud deploy automates deploys to GKE

Victor Szalvay and S. Bogdan, Google Cloud

  • GKEへの継続的デリバリーをより簡単に、より速く、より信頼性の高いものにする、マネージドで、こだわりのある(opinionated)継続的デリバリーサービスである「Google Cloud Deploy」のリリースを紹介している記事。約2分半のYouTube動画が埋め込まれている。
Top open source CI/CD tools for Kubernetes to know

Michael Foster & Ajmal Kohgadai, Red Hat

Ask an OpenShift admin (Ep 44): Kubernetes API deprecations

Andrew Sullivan, Chris Short, Rob Szumski, Camila Macedo, & Frederic Giloux, Red Hat

  • Kubernetes v1.22の変更として、以前に非推奨としてマークされていたいくつかのAPIが削除され、使用できなくなる点をカバーするために詳細まで掘り下げている。それによりAPIバージョンが削除されないようにし、新しいAPIにアップグレードするために必要な手順を解説している約65分間のセッション。
Macquarie Bank looks to break free of IaaS

Ry Crozier, iTnews

  • Google cloud summitでのMacquarie Bank社の発表を元にした記事。同社は最終的にすべてのシステムのホームとなるパブリッククラウドを管理するため、NoOpsモデルへの移行を目論んでいる。
Bug Bash presented by CNCF + Sonatype

CNCF

  • 2021年10月13日8:00 - 2021年10月14日18:00 (PDT)に開催予定の上記タイトルのイベント登録ページ。ご興味のある方は登録を。

Upcoming CNCF Online Programs

Live Webinar
Cloud Native Live
On-demand Webinars

Looking for more great curated content? Visit our Online Programs playlist on YouTube.

Learn more about CNCF Online Programs


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara