運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#67(2021/5/9)

The English Version of this blog is here.

この記事は2021/5/9発行の下記2つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。(KubeWeeklyは今週休み)

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #541 May 9th, 2021
SRE Weekly Issue #269 May 9th, 2021
KubeWeekly #262 May 21st, 2021←KubeCon + CloudNativeCon Europe 2021のためKubeWeeklyは2週間休み、5/21に再開予定。
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #541 May 9th, 2021

News


Are developer portals (like those powered by Backstage) an anti-pattern? This post argues yes.
The full playlist of talks from last week's GitOps Con event with case studies and deep dive technical sessions.
  • GitOps Con 2021のYouTubeで公開されているplaylist。
An interesting post on hosting SQLite databases on static hosting, in this case GitHub pages. SQlite databases are just files, and the post shows how to compile SQLite itself to WASM for serving.
  • タイトルは「Hosting SQLite databases on Github Pages」。
  • 上記の通り、筆者が書いたツールで静的なWebサイトでSQLiteデータベースを使用する方法を紹介している。
AWS CDK now supports Java, allowing for native deployment tooling for another ecosystem. This post demonstrates deploying a Java app to Lambda using CDK.
  • タイトルは「Packaging and deploying AWS Lambda functions written in Java with AWS Cloud Development Kit」。
  • 上記の通り、AWS CDKを介して外部依存関係を持つJavaで記述されたLambda関数をビルドしてパッケージ化する方法を解説している。
Pyston is an alternative Python runtime (technically a fork of CPython) that purports to be 30% faster for common workloads. Originally developed at Dropbox, Pyston is now an open source project.
  • タイトルは「Pyston v2.2: faster and open source」。
  • Pythonのより高速な実装である「Pyston」の最新バージョンであるPyston v2.2を紹介している。

Jobs

Gitpod.io is looking for senior engineers helping to build out our SRE team.

Want to work in open source and fully-remote with some of the world's most talented K8s and developer tools engineers? You are obsessed with DevX and automating our workflows? We pioneered the concept of dev-environments-as-code and provision automated and ready-to-code development environments that blend in your existing workflow. We'd love to hear from you.

  • 上記の通り、シニアエンジニアの複数ポジションの求人情報。

Tools

Pixie is an observability stack for Kubernetes applications. It provides dashboards and a handy CLI tool, and doesn’t require complex instrumentation.
  • コードを変更せずにメトリック、イベント、トレース、およびログにアクセスでき、即座に可視性を提供する「Pixie」のWebページ。
  • GitHubページはこちら
DazedAndConfused is a tool for helping identify dependency confusion attacks, with support for a wide range of different package managers.
  • 依存関係を判断するのに役立つツール「DazedAndConfused」のGitHubページ。
kcp is a prototype of a Kubernetes API server that is not a Kubernetes cluster. If you’re interested in Kubernetes-like APIs but for other tools this might be interesting to watch.
  • 最小限のKubernetes APIサーバー「kcp」のGitHubページ。
Pinniped is the easy, secure way to log in to your Kubernetes clusters, including support for OpenID Connect.
  • Kubernetesクラスターの認証サービス「Pinniped」のWebページ。

SRE Weekly Issue #269 May 9th, 2021

Articles

Edgar: Solving Mysteries Faster with Observability

We built Edgar to ease this burden, by empowering our users to troubleshoot distributed systems efficiently with the help of a summarized presentation of request tracing, logs, analysis, and metadata.

Kevin Lew, Maulik Pandey, Narayanan Arunachalam, Dustin Haffner, Andrei Ushakov, Seth Katz, Greg Burrell, Ram Vaithilingam, Mike Smith and Elizabeth Carretto — Netflix

  • Netflix社の分散システムのトラブルシューティングを行うためのセルフサービスツールである 「 Edgar」を紹介している2020/09/03の記事。当時の段階で「オープンソース化の要望」に対しては、以下の回答であった。
    • Unfortunately, we don't have any short-term plans to open source Edgar, but it's on our radar as something to consider. A lot of Edgar is very Netflix-specific, and we'd have some work to do to make it abstract enough and consumable enough for open source. But maybe someday!
The Comprehensive Site Reliability Engineering (SRE) PDF

The PDF covers 5 main areas:

  1. Availability
  2. Performance
  3. Monitoring
  4. Incident Response
  5. Preparation

No account required or form to fill out to download the PDF.

Splunk/VictorOps

  • ガイドブック「Resilience First」から上記5つのSREの「Core components of SRE」を中心に解説している。
  • 末尾に「Additional SRE resources」のコーナーで他の参考資料を紹介している。
What are MTTx Metrics Good For? Let’s Find Out.

This one’s especially interesting for the section about what MTTx metrics aren’t good for, and the following section on how to improve them.

Emily Arnott — Blameless

  • タイトル通り、Xまでの平均時間を表すMTTx Metricsの良さを下記のポイントで解説している。
    • What are common MTTx metrics and why are they used?
    • What are some problems with relying on MTTx metrics?
    • How can I make MTTx metrics more helpful?
    • How do I move away from shallow metrics?
    • How better metrics help build a blameless culture
Resiliency and Disaster Recovery with Kafka

If you’re interested in deploying Kafka in a multi-region configuration, eBay has put quite a bit of thought into this and has a lot to share.

Engin Yoeyen — eBay

  • 順序付けられたイベントを必要とする技術シナリオの概要を説明し、いくつかの課題に光を当て、マルチリージョンのKafkaセットアップを実行するための可能なソリューションを解説している。
What Chaos Engineering Is (and Isn’t)

Straight from someone who was there from the start. The “what chaos engineering is not” section is especially enlightening.

Casey Rosenthal — Verica

  • タイトルに沿って、カオスエンジニアリングの歴史的な経緯やポイントを解説している。
Heroku incident #2226 follow-up: Private Space apps experiencing domain to SSL cert mapping errors

The last paragraph regarding “unknown unknowns” is noteworthy.

Heroku

  • 上記Editorのコメント通り、「unknown, unknown」 の部分がこの記事のハイライト。
Failover Conf follow-up: Your team and culture questions answered!

There are some great questions in here on blamelessness and full service ownership.

James Thigpen — Gremlin

  • Failover Confのフォローアップとして、時間の都合上パネリストが答え切れなかった質問の回答を回答し、テーマであった「evolution」に触れている。
  • キレイな各セッションのイラストが良い。

Outages

上記各社の障害情報


KubeWeekly #262 May 21st, 2021←KubeCon + CloudNativeCon Europe 2021のためKubeWeeklyは2週間休み、5/21に再開予定。

いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara