運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#75(2021/7/4~7/9)

The English Version of this blog is here.

この記事は2021/7/4〜7/9発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #549 July 4th, 2021
SRE Weekly Issue #277 July 4th, 2021
KubeWeekly #267 July 9th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #549 July 4th, 2021

News

A detailed discussion of why it’s a bad idea to treat an event broker as a database, even with strong consistency guarantees.
  • タイトルは「Brokers Aren't Databases」。
  • 上記のEditorコメントにあるbad ideaについて解説し、代案として「Swim」を紹介している。
A post coining the term PAGNI, for things you probably are going to need to implement, or that benefit you to have early, like automated deployment, continuous integration, mobile kill switches and more.
  • タイトルは「PAGNIs: Probably Are Gonna Need Its」。
  • Luke Plant氏の「YAGNI exceptions」の投稿を見て着想を得た筆者が「YAGNI(You Ain’t Gonna Need It)」と対比して「PAGNIs(Probably Are Gonna Need Its)」という造語を提案している。
A good primer on BPF, taking the angle of helping add observability using BPF to your own software.
  • タイトルは「How To Add eBPF Observability To Your Product」。
  • タイトル通り、以下の項目でeBPFの可観測性をプロダクトに取り入れるステップを解説している。
    1. Run your first tool
    2. Add a tool to your product
    3. Don't worry about dependencies
    4. Version 1 dashboard
  • 上記のステップの後、以下のケーススタディーとアイデアで締め括っている。
    • Case study: Netflix
    • Case study: Facebook
    • Think like a sysadmin, not like a programmer
A set of best practices for anyone using Helm with Kubernetes. Tips on documentation, dependencies, labels, testing and secrets and more.
  • タイトルは「13 Best Practices for using Helm」。
  • タイトル通り、チームがproduction-gradeの分散アプリケーションを作成、運用、およびアップグレードするのに役立つ以下13のベストプラクティスを紹介している。
    1. Take Advantage of the Helm Ecosystem
    2. Use Subcharts to Manage Your Dependencies
    3. Use Labels to Find Resources Easily
    4. Document Your Charts
    5. Test Your Charts
    6. Ensure Secrets Are Secure
    7. Make Your Chart Reusable by Using Template Functions
    8. Update Your Deployments When ConfigMaps or Secrets Change
    9. Opt Out of Resource Deletion with Resource Policies
    10. Useful Commands for Debugging Helm Charts
    11. Use the lookup Function to Avoid Secret Regeneration
    12. Migrate to Helm 3 for Simpler and More Secure Kubernetes Applications
    13. Keep Your Continuous Delivery Pipelines Idempotent
Grafana supports sharing reusable dashboards, and this post contains some interesting examples covering everything from Splunk to Elixir and Kubernetes to GitHub.
  • タイトルは「Grafana dashboard showcase: Visualizations for Prometheus, home energy usage, GitHub, and more!」。
  • GrafanaCONline2021の開催終了、Grafana8とTempo1.0のリリースなどを記念して、ダッシュボードショーケースを共有している。
  • 紹介されている12個のダッシュボードはGrafana Labs社のWebサイトで入手でき、ダッシュボードIDをコピーして貼り付けることで、Grafanaインスタンスに簡単に追加できる。
A tongue-in-cheek post on emulating the design of 30 year old software using modern multi-language, multi-service, architecture.
  • タイトルは「Bringing emulation into the 21st century」。
  • タイトル通り、エミュレーションに21世紀のクラウド、分散アーキテクチャーをもたらそうと以下の思いで筆者が実施したプロジェクトについて書かれている記事。
    • This project was born out of a desire to bring the best of modern design back to the the future of ancient computing history.

Tools

Kubewarden is a new entry into the policy engine space for Kubernetes. Policies are written in existing programming, as long as they can be compiled to webassembly.
  • 上記の特徴があるKubernetes用の新たなポリシーエンジン「Kubewarden」のGitHubページ。コンテナレジストリーを利用して配布でき、CI/CDパイプラインに組み込んで簡単に検証できる。
DuckDB is an open source in-process SQL database management system. Lots of interesting use cases and packages available for various programming languages.
  • インプロセスのSQL OLAPデータベース管理システム「DuckDB」のorgページ。「When to use DuckDB」と「When to not use DuckDB」の記載があり、視覚的にポイントを捉えやすい。
  • GitHubページはこちら
Ever wanted to distribute APT packages publicly, or without having to set up a repository infrastructure? This plugin allows for using a standard OCI container registry for package distribution.
  • 「apt-transport-oci」のGitHubページ。以下の「Motivation」の項目にポイントが明記されている。
    • The motivation is to distribute *.deb packages without running a web server but using a popular fully-managed service such as ghcr.io.
    • If GitHub could offer fully-managed apt repo, this plugin wouldn't be needed.
Leapp is a local tool for managing cloud resources, keeping the credentials encrypted locally and provisioning time-limited credentials for management when needed.
  • Electron上に構築されたクロスプラットフォームのクラウドアクセスアプリ「Leapp」のGitHubページ。

SRE Weekly Issue #277 July 4th, 2021

Articles

FINRA Orders Record Financial Penalties Against Robinhood Financial LLC

Remember all those Robinhood outages? The US financial regulatory agency is making Robinhood repay folks for the losses they sustained as a result and also fining them for other reasons.

Michelle Ong, Ray Pellecchia, Angelita Plemmer Williams, and Andrew DeSouza — FINRA

  • Robinhood Financial LLCはFINRAより、組織的な監督上の失敗と何百万もの顧客が被った重大な損害に対して約7000万ドルを支払うように命じられた。
    • 内訳は、(1)5,700万ドルの罰金、(2)数千人の被害を受けた顧客に対しての1,260万ドルの賠償金と利息。
r/WallStreetBets Incident Anthology: More Data, More Problems

This is brilliant and I wish I’d thought of it years ago:

One of the things we’ve previously seen during database incidents is that a set of impacted tables can provide a unique fingerprint to identify a feature that’s triggering issues.

Courtney Wang — Reddit

  • 先週も取り上げているRedditのインシデントふりかえりのシリーズから。この記事ではタイトルの内容を以下の項目で解説している。
    • Sticky Thread Situation
    • Cache-Thing’s Caching Ceiling
    • The Aftermath
The Deeper Root Cause of the Fastly and Akamai Outages

The suggested root cause involves consolidation in cloud providers and the importance of DNS.

Alban Kwan — CircleID

Full disclosure: Fastly, my employer, is mentioned.

  • 以下の観点に立って、タイトルに沿って非技術的な根本原因を解説している。
    • As the technical root cause of the Fastly and Akamai incidents are something uncontrollable by the enterprises, how can we trust it less and mitigate the risk? For this, we dive deep into its non-technical root cause.
The normalization of deviance in healthcare delivery

This paper is about recognizing normalization of deviance and techniques for dealing with it. This tidbit really made me think:

[…] they might have been taught a system deviation without realizing that it was so […]

Bus Horiz

  • 時間の経過とともに、診療基準のひどい違反でさえ、医療提供システムで「正常化(normalization)」される可能性があることを述べ、この正常化につながる理由と、問題となっている標準の重要性にもかかわらず、重大な慣行の逸脱が何年も続く可能性がある理由を解説している。
Elephant in the Blameless War Room: Accountability

Blameless incident analysis is often at odds with a desire to “hold people accountable”. This article explores that conflict and techniques for managing the needs involved.

Christina Tan and Emily Arnott — Blameless

  • 上記のEditorのコメント通り、非難なき障害分析と説明責任の競合について、以下のポイントで解説している。
    • What blaming executives want when they blame
    • How to skillfully respond to demands for blame
    • When is accountability fair game?
    • How to be blamelessly accountable
Shipping on a Spent Error Budget

What can you do if you’re out of error budget but you still want to deliver new features? Get creative.

Paul Osman — Honeycomb

  • Honeycomb社で「burned error budget」を使用して、機能の出荷方法を変更した時のことを紹介している。
The SRE Incident Response game

I am going to go through the variation we use to up skill our on-call engineers we called “The Kobayashi Maru”, the name we borrowed from the Star Trek training exercise to test the character of Starfleet cadets.

Bruce Dominguez

  • タイトル通り、SREのインシデント対応のドリルをゲーム化していくステップ/方法/ゴールなどを紹介している。

Outages

上記各社の障害情報


KubeWeekly #267 July 9th, 2021

The Headlines

Editor’s pick of the highlights from the past week.

What workloads do customers run on Kubernetes?

Jehlum Vitasta Pandit, Red Hat

Pulse and Red Hat surveyed 100 enterprise tech leaders from multiple industries to find out what workloads they are deploying on containers and Kubernetes, and why and how they are deploying those workloads across hybrid cloud environments, including the usage of Kubernetes Operators and Helm charts to help achieve key business goals and objectives. Uncover the key findings.

  • 上記の調査結果を視覚的に分かりやすいグラフを利用して解説している。グラフ全体を見る場合は記事内にある「click here」から。

f:id:Yoshiki0705:20210710141446p:plain

Enhance your KubeCon + CloudNativeCon North America experience by registering for a CNCF-hosted co-located event (additional registration and fee required) on October 11 or 12. These events bring together industry experts in some of the most popular projects and topics. Visit the event website to register, learn more about becoming a sponsor, and submit a session proposal. The CFP is open through July 25 at 11:59 PM PDT and you can email sponsor@cncf.io to learn more about sponsorship.

  • 上記の通り、KubeCon + CloudNativeCon North America 2021のco-located eventとそのCFP、スポンサーシップの紹介。

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Improving the Kubernetes experience - eliminating toil and tribal knowledge

Billie Cleek, DigitalOcean

  • コントローラを構築するための一連のgoライブラリである「Kubernetes controller-runtime」を使用して、変化するKubernetes admission controllerの作成方法を以下の項目で案内している約58分間のセッション。
    • How to use controller-runtime
    • How to configure and use mutating admission webhooks
    • How to provide a more consistent experience for users of a cluster
How to share a Kubernetes cluster securely through Lens spaces

Edward Ionel, Mirantis

  • Team Lensが、LensSpacesを介してKubernetesクラスターを安全に共有する方法を以下の項目で紹介している約23分間のセッション。
    • Securely share a Kubernetes cluster via Lens Spaces
    • Access Cloud Native resource through your Catalog
    • Build workflows via the Hotbar


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Containers in the cloud: What are your options?

Kentaro Wakayama, Coder Society

  • 3大クラウドベンダーの環境にコンテナをデプロイするための、一般的なオプションとユースケースを解説している。
Prometheus HA with Thanos Sidecar Or Receiver?

Tayyab Jamadar, InfraCloud

  • Kubernetes環境でThanosをPrometheusと統合するための2つの異なるアプローチ(Sidecar/Receiver)を紹介し、特定のアプローチを採用する理由を探っている。
Evaluation of caching methodologies for Microservice-Based Architectures in Kubernetes

Joel Sandman, Elastisys

  • タイトルの内容を以下の項目に沿ってグラフと表を交えて解説している。
    • Introduction
    • Community or Business Value
    • Experimental Design and Setup
    • Interpretation of Results
    • Conclusions
Full Stack Kubernetes with Kong Ingress Controller

Michael Bogan, DevSpotlight

  • Kubernetesを使用したフルスタックアプリケーションのデプロイにKongを使用する方法を解説している。
  • この記事で言うフルスタックとは、Kongが以下を処理できることを意味している。
    • Containers
    • Container networking
    • Pod networking
    • Service networking
    • Host networking
    • Load balancing
    • Rate limiting
    • HTTPS redirects
KubeEdge: cloud native edge computing

KubeEdge Maintainers

  • KubeEdgeのMaintainer達がそのアーキテクチャー、コードディレクトリ、およびクラスターのデプロイを図を交えて解説している。
Everything useful I know about kubectl

Alex Woods, Ware2Go

  • タイトル通り、筆者がkubectlについて知り得る有益な情報をまとめてくれている。
How to use Podman inside of a container

Dan Walsh and Urvashi Mohnani, Red Hat

  • 特権の説明から始めて、以下のルートフルとルートレスの各組み合わせについて解説している。
    • Rootful Podman in rootful Podman
    • Rootless Podman in rootful Podman
    • Rootful Podman in rootless Podman
    • Rootless Podman in rootless Podman
  • このシリーズのパート2では、PodmanとKubernetesの使用について解説していく模様。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Managing SREs to 90+ container talks a year with Jérôme Petazzoni

CTCN Podcast

  • ゲストのJérôme Petazzoni氏がDockerにどのように関与したか(開始時はdotCloud PaaS)、そこで行った仕事をどのように行ったか、Dockerのコードベースのどの部分に触れたかなど、興味深い話が聞ける約38分間のPodcast。
Flux July 2021 update

Daniel Holbach, Flux

  • Fluxの7月のアップデートとして、6月のリキャップとして、以下の項目で解説している。
    • From now on Flux APIs will be stable
    • Flux Project Facts
    • New releases in the Flux family
    • Upcoming events
    • In other news
    • Over and out
What end-users want out of Prometheus remote storage: A comparison of M3 and Thanos

Gibbs Cullen, Chronosphere

  • KubeWeekly #266 June 25th, 2021で以前取り上げているので、割愛。同じコーナーで再度取り上げているが、差分は見当たらない。
FinOps for Kubernetes: Insufficient – or nonexistent – Kubernetes cost monitoring is causing overspend

CNCF

  • CNCFがFinOps Foundationの支援を受けて、コミュニティーの範囲を拡大したマイクロサーベイを実施し、組織がFInOpsまたはCloud Financial Managementを使用してKubernetesとクラウドコストをどのように管理しているか、を確認した結果を共有している。
From a newbie in software engineering to a graduated LFX-mentee

Debabrata Panigrahi, LFX Mentee at Chaos Mesh

  • ソフトウェアエンジニアリングの初心者ながらChaos MeshのLFXメンティーに選ばれた筆者によって、プログラムへの参加から卒業、次のステップについて語られている。
The next generation of Kubernetes Native Postgres

Jonathan S. Katz, Crunchy Data

  • CrunchyDataのオープンソースPostgresOperatorであるPGO5.0のリリースの発表に合わせて、このリリースの背景についてから解説している。
Join the CNCF Students for “Getting started with non-code contributions” on July 10 - RSVP
  • コード以外のcontributionと、Kubernetesエコシステムへのcontributionを開始する方法を解説している約98分間のセッション。
The Business Value Track is back for KubeCon + CloudNativeCon North America and the CFP is open! Be sure to submit your CFP by July 14.
  • クラウドネイティブのビジネス価値の促進に関心のある人は「Business Value Track」の35分間のセッションのCFPを2021/07/14 12:00 pm EDTまで提出可能。

Last chance reminder: Take the CNCF Cloud Native Survey - Part 1 to share your thoughts on cloud, containers, and Kubernetes. Complete it now for a chance to win a CNCF store gift card! The survey will close on July 15.

  • 「CNCF Cloud Native Survey - Part 1」の最終リマインダー。

Upcoming CNCF Online Programs

Cloud Native Live

Learn more about CNCF Online Programs


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara