運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#76(2021/7/11~7/16)

The English Version of this blog is here.

この記事は2021/7/11〜7/16発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #550 July 11th, 2021
SRE Weekly Issue #278 July 11th, 2021
KubeWeekly #268 July 16th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #550 July 11th, 2021

News

WebAssembly is interesting and important. It’s now getting to the point where it’s in active use for lots of interesting use cases. This post is a great introduction to the current ecosystem.
  • タイトルは「What Is WebAssembly — and Why Are You Hearing So Much About It?」。
  • 上記のEditorのコメント通り、WebAssembly の現在のエコシステムの導入として良い記事で、以下のポイントで解説している。
    • Secure Extensibility
    • Out of the Browser and into the Cloud
    • Revolutionizing Cloud Dev
    • A Productivity Boost
Security conversations are too often cursed with binary thinking. This post has lots of examples, from compliance to open source, incident management and more.
  • タイトルは「Cybersecurity and the Curse of Binary Thinking」。
  • タイトル通り「What is said」と「Reality」の二項対立で各項目とその捉え方の問題点を解説している。
Grafana supports sharing dashboards, but can lead to lots of repetition in definitions. Enter Grafonnet, using Jsonnet to maximise reuse.
  • タイトルは「Dashboards, dashboards everywhere (as code)」。
  • Grafanaダッシュボードをコーディングするために使用できるjsonnetライブラリである「Grafonnet」を紹介している。
An interesting discussion of the tradeoffs with how teams choose to develop software, balancing predictability and speed of feedback, with two extreme examples and talk of risk appetite.
  • タイトルは「The Right Way to Ship Software」。
  • CTOサミットで行われたセッションの要約記事。さまざまな環境でソフトウェアを送り出した経験を共有し、スタートアップに独自のリリースプロセスの構築方法をアドバイスしている。
A detailed post on tips for adopting a serverless architecture on AWS, including discussion of the mindset shift and benefits of upfront training on the differences.
  • タイトルは「Going Serverless (on AWS)」。
  • 筆者のAWS環境のサーバーレス化の経験から、サーバーレスの採用時に発生し得る摩擦の対処方法を解説している。
A look at multi-cluster support in Kubernetes, using Kind to launch several clusters for testing and Submariner and Calico for the networking.
  • タイトルは「Kubernetes Multicluster with Kind and Submariner」。
  • 複数のKubernetesクラスターをローカルで作成し、KindおよびSubmarinerで直接通信を確立する方法を解説している。
A comprehensive post on essential tools for Kubernetes, covering deployment, build, security, policy, higher-level interfaces, extensions and lots more. It does point to the size and complexity of the ecosystem now.
  • タイトルは「Kubernetes Essential Tools: 2021」。
  • Kubernetesでお気に入りのツールを要約し、特に人気が高まると思われる最新のあまり知られていないツールに重点を置いて解説している。
  • 筆者自身のバイアスを避けるため、各ツールの代替案についても言及し、読者がニーズに基づいて比較および判断できるようにしている。

Tools

Space Cloud is a Kubernetes based serverless platform that provides instant, real time APIs on any database, with event triggers. Think Firebase on Kubernetes.
  • Kubernetesベースのサーバーレスプラットフォーム「Space Cloud」のGitHubページ。任意のデータベースでインスタントのリアルタイムAPIを提供し、カスタムビジネスロジック用のイベントトリガーと統合APIを備えている。
Turbolift automates forking, cloning, committing, and raising PRs against a large number of Git repositories. Handy for those organization wide changes that sometimes need making like adding, removing or modifying specific files.
  • 多くのGitHubリポジトリに同時に変更を適用するのに役立つシンプルなツール「Turbolift」のGitHubページ。

SRE Weekly Issue #278 July 11th, 2021

Articles

That Sinking Feeling (The #HugOps Song)

Whoa. This is the best thing ever. I feel like I want to make this the official theme song of SRE Weekly.

Forrest Brazeal

  • YoutTube動画でタイトルは「That Sinking Feeling (The #HugOps Song)」。この動画の歌を聴いてとてもポジティブな気持ちになれたので、オススメです。
r/WallStreetBets Incident Anthology (What Worked Edition): Autoscaler

Their auto-scaling algorithm needed a tweak. Before: scale up by N instances. After: scale up by an amount proportional to the current number of instances.

Fran Garcia — Reddit

  • 障害のふりかえりシリーズの一記事。「What Worked」としてどのようにAutoscalerが活躍したかを解説している。
The Incident Review: 4 Incidents in Outer Space

here’s a look at incidents and reliability challenges that have occurred in outer space, and what SREs stand to learn from them.

JJ Tang — Rootly

  • 上記のタイトルとEditorの抜粋通り、以下4つの宇宙空間でのインシデントと信頼性のチャレンジをSREの観点から分析している。
Prepare for overnight success — with the right load testing approach

This one includes 3 key things to remember while load testing. My favorite: test the whole system, not just parts.

Cortex

  • ほとんどのスタートアップが負荷試験について間違っている以下3つのことを紹介し、負荷試験にCortexを使用することを提案している。
    1. Testing your entire production setup, rather than isolated services.
    2. Defining clear ownership so that someone is responsible for load testing.
    3. Achieving cultural buy-in within the team so the right actions are taken to improve performance.
4 ways to improve your influence as an SRE

SRE is as much about building consensus and earning buy-in as it is about actual engineering.

Cortex

  • 冒頭でSREにとっての影響力の重要性について触れ、タイトルに沿って以下4つのポイントを解説している。
    1. Tie your work directly to the business bottom line
    2. Build bridges quickly and lower gates slowly
    3. Drive conversations on standardization and automation
    4. Make your process as self-serve as possible
NoOps: What Does the Future Hold for DevOps Engineers?

The definition of NoOps in this article is more clear than others I’ve seen. It’s not about firing your operations team — their skill set is still necessary.

Kentaro Wakayama

  • タイトルに沿って、以下の項目で解説している。
    • DevOps vs. NoOps
    • NoOps: Advantages and Challenges
    • Destination NoOps
Systems Observability

Even though I know what observability is, I got a lot out of this article. It has some excellent examples of questions that are hard to answer with traditional dashboards, and includes my new favorite term:

The industrial term for this problem is Watermelon Metrics; A situation where individual dashboards look green, but the overall performance is broken and red inside.

Nishant Modak and Piyush Verma — Last9

  • 上記のEditorコメント通り、「既存のダッシュボードが未知の問題を検出することはめったにない状態」を表す業界用語の「Watermelon Metrics」:個々のダッシュボードは緑色に見えるが全体的なパフォーマンスが壊れており内実は赤色になっている状況、を紹介しタイトルの「Systems Observability]」について解説している。
Controlling a process we don’t understand

Instead, we should consider the fields there where practitioners are responsible for controlling a dynamic process that’s too complex for humans to fully understand.

Lorin Hochstein

  • 自他の肩書きや捉え方について線引きをしたくなる人が一定数いると思いますが、私は筆者の以下の考え方に同意します。
    • Whether we are engineers or not doesn’t matter. We’re all operators doing our best to bring complex systems under our control. We face similar challenges, and we should recognize that. That is why I’m so fascinated by fields like cognitive systems engineering and resilience engineering. Because it’s so damned relevant to the kind of work that we do in the world of building and operating cloud services.
Troubleshooting: A journey into the unknown

In this epic troubleshooting story, a weird curl bug coupled with Linux memory tuning parameters led to unexpected CPU consumption in an unrelated process.

Pavlos Parissis — Booking.com

  • 2017年4月14日付けの記事。上記の通り、トラブルシューティングを旅として捉え、グラフを交えて丁寧に解説している。
How Back Market SREs prepared for Black Friday

Learning a lesson from a rough Black Friday in 2019, these folks used load testing to gather hard data on how they would likely fare in 2020.

Mathieu Garstecki — Back Market

  • eコマースプラットフォームにとって大きなイベントであるブラックフライデー(専門用語ではBF)の2019年に直面した課題から、2020年にいかに改善したかを解説している。

Outages

上記各社の障害情報


KubeWeekly #268 July 16th, 2021

The Headlines

Editor’s pick of the highlights from the past week.

Spring Term LFX Program: Largest graduating class with 28 successful CNCF interns!

Ihor Dvoretskyi, CNCF

28 interns have just successfully graduated from the latest LFX mentorship program funded by CNCF. 16 CNCF Graduated, Incubating and Sandbox projects joined this round with projects from Crossplane, Kubernetes, Thanos, Tremor and Volcano. Learn more about the latest graduating team. Congrats to all the interns!

  • 上記の通り、28人のインターンがCNCFが資金提供する最新のLFXメンターシッププログラムを無事に卒業したことを祝って、各プロジェクトと参加したインターンのコメントを紹介している。

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

Multi cluster Linkerd - Extending apps between New York and London

Jason Morgan, Buoyant

  • タイトル通り、Linkerdのマルチクラスター拡張機能を使用して2つのデータセンター間に渡ってアプリを拡張する方法を解説している約45分間のセッション。


The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Announcing Vitess Arewefastyet

Florent Poinsard & Manan Gupta, Vitess

  • FirefoxRustなどの他のオープンソースプロジェクトのパフォーマンス追跡の取り組みに触発された継続的なベンチマークツールセット「arewefastyet」を紹介している。
The next generation of Kubernetes Native Postgres

Jonathan S. Katz, Crunchy Data

OpsLevel’s Kubernetes sync: Bootstrap and enrich your service catalog

Andrew Connolly, OpsLevel

  • タイトル通りOpsLevel社の新たな機能「Kubernetes Sync」を以下の3つのポイントで紹介している。
    • Getting Started
    • Staying Current
    • Building for Consistency and Reliability
Scheduled-scaling with Kubernetes HPA External Metrics

Takeshi Kondo, Quipper

Fixing Ingress for short-lived local Kubernetes clusters

Alex Ellis, Inlets

  • Kubernetes Operator patternがどのように機能するかを調べ、inletsの操作経験をコードにエンコードすることを紹介している。


The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Gatekeeper and policy controller, with Max Smythe

Craig Box, Kubernetes Podcast from Google

What is workload security? On-Premises, cloud, Kubernetes, and more

Michael Foster, Red Hat

  • タイトルの内容を以下の項目で解説している。
    • What Is a Workload?
    • The Challenge in Defining Your Workloads
    • How We Traditionally Secured Our Workloads
    • Managing Your Workloads Has Changed
    • Securing Your Workloads Has Changed
    • Kubernetes Workloads Are Managed Differently
    • Kubernetes Workloads Are Secured Differently
    • What Is Workload Security?
    • In Summary
NoOps: What does the future hold for DevOps engineers?

Kentaro Wakayama, Coder Society

  • 上記のSRE Weekly Issue #278で取り上げているので割愛。
99.99999% Uptime with Anna Berenberg

Curiefense podcast

  • 約34分間のPodcastと、Podcastのポイントの書き起こし記事。
Automate service mesh observability with Kuma

Marco Palladino, Kong

Could Kubernetes pods ever become deprecated?

Martin Heinz

  • タイトルの内容について、以下の項目で解説している。
    • Long Story Short
    • The Long Story
    • REST Objects
    • Flags or CLI
    • Feature Gates
    • Metrics
    • Conclusion
Don’t miss Tremor Con 2021, a free, virtual mini-conference on Tremor on Sept 6! RSVP today.
  • Tremorに関する無料のバーチャルミニカンファレンス「Tremor Con 2021」の紹介。
Reminder: The CFP for some co-located events at KubeCon + CloudNativeCon closes on July 25 at 11:59 PM PDT!
  • 先週紹介のあった、KubeCon + CloudNativeCon North America 2021のco-located eventのCFPのリマインダー。

Upcoming CNCF Online Programs

Cloud Native Live
On-demand

Learn more about CNCF Online Programs


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara