運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#91(2021/10/24~10/29)

The English Version of this blog is here.

この記事は2021/10/24~10/29発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #565 October 24th, 2021
SRE Weekly Issue #293 October 24th, 2021
KubeWeekly #281 October 29th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #565 October 24th, 2021

News

  • KubeCon + CloudNativeCon NA 2021のrecapの記事を3つ取り上げている。
  • 上記リンクの1つ目の記事のタイトルは「KubeCon NA 2021 Key Takeaways: DevX, Security, and Community」。筆者や他の参加者のツイートを引用しながら解説している。
  • 2つ目の記事のタイトルは「KubeCon 2021 Los Angeles Wrapup」。筆者のツイートと共にふりかえっている。
  • 3つ目の記事のタイトルは「KubeCon 2021 Top 3 Announcements: APIClarity, HashiCorp Waypoint, and Dell EMC CSM」。筆者がアプリのアプリのモダン化を阻んでいる要素を押し退ける観点で、高いポテンシャルを感じた3つのプロダクトを紹介している。
An insightful post on the sometimes hard-to-define distinction between application and infrastructure. A static/dynamic linking analogy, how the Kubernetes API and Crossplane fit in, and the potential for a new type of marketplace for applications.
  • タイトルは「INFRASTRUCTURE IN YOUR SOFTWARE PACKAGES」。
  • 現在の状況を詳しく説明し、ソフトウェアのデリバリーが時間の経過とともにどのように進化してきたかを評価することにより、ソフトウェアとともにシッピングインフラストラクチャーの将来がどのようになるかを分析している。
Game servers are a super interesting scaling challenge. This post, about recent outstages for a large game, goes into some great operational, data storage and architecture details.
  • タイトルは「Diablo II: Resurrected Outages: An explanation, how we’ve been working on it, and how we’re moving forward」。
  • 「Diablo II:Resurrected」の発売以来、複数のサーバーで発生してきた問題の原因と、これまで担当チームが行ってきた対処の手順を一定の透明性をもって公開している。また、どのように前進しているか洞察を提供している。
A look at how one team is evolving a large NFS file storage setup towards something that is easier to scale horizontally and automatically.
  • タイトルは「Iterating on how we do NFS at Wikimedia Cloud Services」。
  • 上記のEditorのコメント通り、WikimediaのクラウドサービスチームがNFSの実行方法を検討し、改善した内容を共有している。
More deep internet networking insights, this time looking under the hood about what makes a valid hostname. It’s worse than you think.
  • タイトルは「What's in a hostname?」。
  • ホスト名について、RFCと付け合わせながら深堀りしている。
A good introduction to the extensibility benefits of Kubernetes, looking at the high-level API, custom resources and the operator pattern.
  • タイトルは「Exploring Kubernetes Operator Pattern」。
  • Operatorsパターンを詳しく見て、どのKubernetesパーツがOperatorの実装に関与しているか、Operatorが「first-class Kubernetes citizens」のように感じられる理由をできるだけ多くのイメージを使って紹介している。
  • Kubernetes APIがおそらくKubernetesの拡張性の主な要因であると解説している。
A post on introducing a production readiness review process, in particular in smaller teams.

Tools

hcltm is a tool for describing a thread model in HCL, and then generating various outputs from it including markdown documents and data flow diagrams.
  • 以下のターゲットに焦点を絞り、システム脅威モデルを文書化するためのDevOpsファーストのアプローチを提供する「hcltm」のGitHubページ。
    • Simple text-file format
    • Simple cli-driven user experience
    • Integration into version control systems (VCS)
Snowcat is a tool that gathers and analyzes the configuration of an Istio cluster and audits it for potential violations of security best practices.
  • 上記の通り、Istioクラスターの構成を収集・分析し、セキュリティーのベストプラクティスの違反の可能性を監査するツール「Snowcat」のGitHubページ。
  • GitHubページはこちら

SRE Weekly Issue #293 October 24th, 2021

Articles

The Downside of Hospitals Becoming “Highly Reliable”

It’s one thing to say you accept call-outs of unsafe situations — it’s another to actually do it. This cardiac surgeon shares what it’s like when high reliability organizations get it wrong.

Robert Poston, MD

  • 病院において、highly reliable organization (HRO)が「透明性と情熱の欠如により、現場のメンバーに対して一連のよくパッケージ化されたアイデアを残し、最終的には高い信頼性のように見えるが、1つのように動作することはできない」ことを解説している。
  • 2019/11/6 付けの記事。
Diablo II: Resurrected Outages: An explanation, how we’ve been working on it, and how we’re moving forward

The game has been a victim of its own success, and the developers have had to put in quite a lot of work to deal with the load.

PezRadar — Blizzard

  • 上記DEVOPS WEEKLY ISSUE #565で取り上げているため、割愛。
An Introduction to Incident Response Roles

This includes some lesser-known roles like Social Media Lead, Legal/Compliance Lead, and Partner Lead.

JJ Tang — Rootly

This article is published by my sponsor, Rootly, but their sponsorship did not influence its inclusion in this issue.

  • 可能な限り効果的かつ効率的に機能するチームを構築するために、インシデント対応の役割を定義する方法を以下のポイントで解説している。
    • What is an incident response team?
    • Structuring incident response roles
    • Other potential incident response roles
    • Conclusion: The best incident response team is a flexible team
Postmortem Pitfalls

There are a couple of great sections in this article, including “blameless” retrospectives that aren’t actually blameless, and being judicious in which remediation actions you take.

Chris Evans — incident.io

  • タイトル通り、以下のポイントでポストモーテムの落とし穴を解説している。
    • When blameless postmortems actually aren't
    • Incidents are always going to happen again
    • Take time before you commit to all the actions
    • Incidents as a process, not an artifact
The danger of hidden functional roles

I love the idea that chaos monkey could actually be propping your infrastructure up. Oops.

Lorin Hochstein

  • 導入の、自身が意図せず家族の目覚まし時計の役割を果たしている話と、後半のChaos Monkeyの繋ぎ方が良い。Chaos Monkeyがインスタンスを終了させることにより問題が発生する前にインスタンスを入れ替えてくれている、その可能性は考えたことが無かった。
What’s in a hostname?

I have to say, I’m really liking this DNS series.

Jan Schaumann

  • 上記DEVOPS WEEKLY ISSUE #565で取り上げているため、割愛。
Crew member yelled ‘cold gun’ as he handed Alec Baldwin prop weapon, court document shows

What? Why the heck am I including this here?

First, let’s all keep in mind that this situation is still very much unfolding, and not much is concretely known about what happened. It’s also emotionally fraught, especially for the victims and their families, and my heart goes out to them.

The thing that caught my eye about this article is that this looks like a classic complex system failure. There’s so much at play that led to this horrible accident, as outlined in this article and others, like this one (Julia Conley, Salon).

Aya Elamroussi, Chloe Melas and Claudia Dominguez — CNN

  • 一見した時に「なぜこの記事が?」と思いました。上記のEditorのコメントにある通り、この件は古典的な複雑なシステム障害に見えるため、取り上げているとのこと。

Outages

上記各社の障害情報。


KubeWeekly #281 October 29th, 2021

The Headlines

Editor’s pick of the highlights from the past week.

Kubernetes Podcast from Google: Jasmine James, KubeCon + CloudNativeCon co-chair

Jasmine James is an Engineering Manager within the Engineering Effectiveness organization at Twitter, focused on their internal developer experience. She was also the co-chair of the recent KubeCon + CloudNativeCon. Jasmine talks about the events she's led and the ones to come, and her feelings about being in a room in front of other people - up to 3,000 of them - for the first time in a long while.


ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Securing your workload communications with Open Service Mesh

Phillip Gibson, Microsoft

  • Open Service Meshを使用して、ワークロード通信を強化するための最新の統合と手法を紹介している約46分間のセッション。
Introducing Kubescape - open-source tool to test Kubernetes deployment

Amir Kaushansky, ARMO

  • Kubescapeを操作する方法、サポートするフレームワーク、主な機能、CI/CD統合を解説している約50分間のセッション。
How to design a multi-cloud deployment

Dave Blakely, Snapt

  • マルチクラウドへ移行する目的、クラウドプロバイダーの選定方法、マルチクラウドにデプロイする方法、マルチクラウドをセキュアに保つ方法などを解説している約40分間のセッション。
Project Calico network policies

Nigel Douglas, Tigera

  • タイトルの内容を以下のポイントで解説している約41分間のセッション。
    • How does Project Calico enable network policies in K8s?
    • How to implement basics?
    • Creating and managing policies in your clusters
Understanding GitOps usecases

Abubakar Siddiq Ango, Gitlab

  • GitOpsとそのユースケース、そしてどういった場合にGitOpsが必要なのかを解説している約30分間のセッション。


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

What you need to know about Kubernetes Network Policy

Mike Calizo, Red Hat

  • KubernetesのNetworkPolicyをYAMLの記載例を交えて、以下のポイントで解説している。
    • The NetworkPolicy concept
    • Applying a network policy
    • NetworkPolicy limitations
    • Summary
The life of an API gateway request (part 1)

Enrique GarcÍa Cota, Kong

  • Kong Gatewayがリクエストを処理する方法の抽象化スペースを4つの異なるレイヤーに分割して解説している記事のPart 1。約13分間の動画が埋め込まれている。
    1. Infrastructure
    2. Nodes
    3. Phases
    4. Plugins
Optimizing Kubernetes applications with Kubecost and Spinnaker

Alex Thilen, Kubecost

  • タイトルの内容を処理の流れやUIのイメージを交えて解説している。以下2つの動画が埋め込まれている。
    • Demo of Kubecost + Spinnaker integration in action
    • Spinnaker Workshop: Cost Optimization with Kubecost’s founders
Announcing HAProxy Kubernetes Ingress Controller 1.7

Ivan Matmati & Zlatko Bratkovic, HAProxy

  • HAProxy Kubernetes Ingress Controllerのバージョン1.7のリリースにあわせて変更点を、以下のポイントで詳しく紹介している。
    • Custom Resource Definitions
    • CRD Examples
    • Distribution of connections to services/pods
    • New ALNP option
    • Implementation specific path type in ingress rules
    • Multiarch Support
    • s6 Init system
    • Nightly builds
    • External mode
    • Contributions
    • Conclusion

Alex Ellis, OpenFaaS Ltd.

  • Inlets、VPC Peering、direct uplinksを使用してサービスをKubernetesクラスターに接続する方法を解説している。
Transitioning from Monolith to Microservices

Michael Bogan, Dev Spotlight

  • 冒頭に「You might not need microservices architecture if…」で以下のポイントを挙げてから、タイトル通りマイクロサービスへの移行を紹介している構成がとても良いと思う。
    • You’re not having trouble scaling.
    • Your monolithic architecture is already flexible enough to meet market demands.
    • You’re not having issues with deploying your application.
Securing a Kubernetes pod with Regula and Open Policy Agent

Becki Lee, Fugue

  • Kubernetesマニフェストで「Regula」を実行して安全でないPodを検出する方法を示してから、それを保護する流れで解説している。
Structure testing for Docker containers

Tomas Fernandez, Semaphore CI

  • Dockerコンテナをデプロイ前にテストする方法として、Googleよりオープンソース化されたコンテナテストツール「Container Structure Tests」を紹介している。
Kustomize tutorial: Creating a Kubernetes app out of multiple pieces

Nick Chase, Mirantis

  • タイトルの内容を以下の項目で解説している。
    • What is Kustomize?
    • Benefits of Using Kustomize
    • Installing Kustomize
    • Combining Specs
    • Managing Multiple Directories
    • Changing Parameters for a Component Using Kustomize Overlays
    • Creating a Kustomize Patch
    • Using Kubectl with Kustomize
    • Example: Kustomize Secret Generator
    • Conclusion
Kube-fledged: Cache container images in Kubernetes

Senthil Raja Chermapandian, Ericcson

  • オープンソースプロジェクトである「kube-fledged」を使用して、Kubernetesクラスター内のコンテナイメージのキャッシュを構築および管理する方法を解説している。
Kubernetes logging in production

Kentaro Wakayama

  • タイトルの内容を以下の構成で解説している。ポイントがとてもよく整理されていて理解が進む。
    • Logging Architectures
    • Logging Patterns
    • Pros and Cons
    • Putting Theory into Practice
    • Conclusion
How to develop a customer provider in Terraform

Saravanan Gnanaguru, InfraCloud Technologies

  • この記事の対象はTerraformとその使用法の基本的な知識があり、カスタムTerraformプロバイダーを開発する可能性が高いTerraformユーザー。
Database security best practices on Kubernetes

Johnathan S. Katz, Crunchy Data

  • タイトルの内容を以下の項目で解説している。
    • Run as an Unprivileged User
    • Encrypt your Data
    • Credential Management
    • Keep Database Software Up-to-Date
    • Follow Configuration Best Practices
    • Limit Where You Can Write
    • Securing The "Weakest Link"
    • Conclusion
How Linkerd retries HTTP requests with bodies

Eliza Weisman, Linkerd

  • Linkerdプロキシーがコピーと割り当てを減らすことで、リクエスト本文のバッファリングのパフォーマンスオーバーヘッドを最小限に抑える方法、プロキシがどのリクエストを再試行できるかを決定する方法、考慮しなければならないいくつかのエッジケースを解説している。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Kubernetes co-founder Joe Beda interview

evrone interview

Kubernetes cost management and analysis guide

Kasper Siig, CloudForecast

  • Kubernetesでコストを管理するのが非常に難しい主な理由を検証している。そして、コスト管理を大幅に改善する方法として、AWS Pricing Calculatorを使用してEKSクラスターの実行と比較して、カスタムKubernetesクラスターでのワークロードの実行に関連するコストを見積る方法を紹介している。
I attended Kubecon 2021 in-person, here are my top six takeaways

Amanda Mitchell, Chronosphere

  • KubeCon + CloudNativeCon NA 2021に参加した筆者が、以下6つのtakeawaysを解説している。
    • 1) A green light for more (safe) in-person events
    • 2) Quantity isn’t everything
    • 3) KubeCon 21 felt like old times (aka two years ago)
    • 4) Love notes and theCube
    • 5) Observability and other key themes
    • 6) Inclusivity themes abound at KubeCon 21
KaaS, KPaaS & CaaS: Explained and compared

Lars Larsson, Elastisys

  • 最新のアプリケーションとコンテナ化されたアプリケーションのマネージドサービスを比較している。
Announcing Vitess 12

Alkin Tezuysal, Vitess


Upcoming CNCF Online Programs

Please note that no Online Programs are scheduled for this upcoming week. Check out our full playlist of content on the button below!

Visit our Online Programs playlist on YouTube.

Learn more about CNCF Online Programs


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara