運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#56(2021/2/21~2/26)

この記事は2021/2/21~2021/2/26発行の下記3つのWeekly Reportを読み、備忘録兼リンク集として残しているものです。

なるべく情報を早く届けたい/共有したいので、ブログのリンクを確認次第、先行公開しています。自身のコメントは随時追加しています。

DEVOPS WEEKLY ISSUE #530 February 21st, 2021
SRE Weekly Issue #258 February 21st, 2021
KubeWeekly #252 February 26th, 2021
  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2020年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #530 February 21st, 2021


News

What to expect from devops in 2021? This post pin-points some evergreen topics like security, a focus on the business, automation, but also the growth of low code and pipeline analytics and monitoring.
  • タイトルは「What to Expect from DevOps This Year: The Experts Weigh In」。
  • Software Delivery Leadership Delivery Forumの特別版として業界のアナリスト達を呼んで上記のタイトルやポイントに沿って解説している。
An interesting post from someone involved with accessing RubyGems after the recent dependency confusion attack interest.
  • タイトルは「RubyGems dependency confusion attack side of things」。
  • Dependency Confusion: How I Hacked Into Apple, Microsoft and Dozens of Other Companies」の記事を受けて、RubyGems側のストーリーを提示し、ユーザーを安心させるために書かれている記事。誤解を避けるために冒頭の「Note」で意図を明記している。
    • Note: This article is not to deprecate any of the findings and achievements of Alex Birsan. He did great work exploiting specific vulnerabilities and patterns. It is to present the RubyGems side of the story and to reassure you. We actively work to provide a healthy and safe ecosystem for our users.
Python is both a great programming language to get started with, and increasingly a useful extra tool to have in your toolbox for data and analytics work. This university course is a good starting place.
  • タイトルは「Learn to Code in Python, with Hany Farid」。
  • 上記のEditorのコメント通り、大学のPython入門講座で無料でYouTube動画の講義を受けられ、付属のコードも見られる。
    • Part 1: Introduction to Programming and Computation
    • Part 2: Introduction to Data Structures and Analytics
Another set of public course materials, this time on Systems Administration fundamentals. Storage, file systems, networking, common protocols, system security, configuration management and ethics for systems administrators among the topics.
  • タイトルは「CS615 -- System Administration」。上記のEditorのコメントとタイトル通りの内容の講座。[slides] [video lecture] [transcript]があり、体系的に学習が進められる。
  • YouTube動画はこちら
A nice post on why lots of people enjoy working in IT. The people, the constant learning, the problem solving and more.
  • タイトルは「What Do You Love Most About Working in IT?」。
  • バレンタインデーを記念して、ITおよびITサービス管理(ITSM)の役割で働く人に、ITで働いていて最も好きなことを尋ねた内容を解説している。
    • The People
    • The Constant Change
    • The Learning
    • The Opportunity to Solve Problems
    • The Varied Challenges
    • Making a Difference/Helping Others
    • Improving Things at an Industry Level
    • Working with the Technology
    • It Pays Well!
The recent changes around the CentOS project, with the new CentOS Streams approach, are triggering some interesting conversations. The new Hyperscale special interest group is just forming to discuss large scale deployment challenges and solutions.
  • タイトルは「Hyperscale SIG」。
  • 上記のEditorのコメント通り、CentOSプロジェクトのCentOS StreamsのHyperscale SIG(special interest group)のWebページ。

Tools

Rclone (rsync for cloud storage) is a command line program to sync files and directories to and from different cloud storage providers like Google Drive, S3, Dropbox, Backblaze B2, One Drive, Google Cloud Storage and more.
A handy web service that makes it easy to check which cloud provider a website is using for it’s public services.
  • 上記の通り対象のWebサイトが公開サービスとして使用しているクラウドプロバイダーを簡単に確認できる便利なオンラインツール「runson.cloud」の Webページ。
The above runson.cloud service is based on a set of handy open source libraries that also have accompanying CLI tools that do the same.
  • 上記の「runson.cloud」に付属しているオープンソースライブラリーの各クラウドベンダーごとのCLIツールAWS/Azure/GCPのGitHubページ。

SRE Weekly Issue #258 February 21st, 2021


Articles

Practiced Humility in Retrospectives

When acting as a retrospective facilitator, there’s a huge potential to color the discussion with our words and actions.

You’re there to position other folks to learn, not wear the badge.

Will Gallego

  • タイトルに繋がる以下の投げ掛けから論じている。
    • Why wouldn’t we be able to simply apply the calculus to our knowledge and change things for the better?
    • This all speaks to a distinct lack of humility in what we do as a practice.
  • 下記項目に沿って解説されていて「Humility In Practice」では実践するための心構えや言動について触れている。
    • Hubris as Facilitator
    • Top Down Misunderstanding of Retrospectives
    • Humility In Practice
GitHub Repo: upgundecha/howtheysre

upgundecha/howtheysre: A curated collection of publicly available resources on how technology and tech-savvy organizations around the world practice Site Reliability Engineering (SRE)

A huge thanks to the curator for the many awesome links in this repo! Some have been featured here in previous issues, and some are new to me. As I go through those, I’ll share my favorites here and tell you why I think you should read them.

Unmesh Gundecha

  • これは、とても良い。世界のテックに精通している企業が公開している「SRE」の実践に関するリソースのリンクが集められているGitHubページ。
  • 先日紹介したLinkedIn社の「School of SRE」や、日本企業ではMercari社のリソースが含まれている。
Engineering dependability and fault tolerance in a distributed system

In this article, we discuss the concepts of dependability and fault tolerance in detail and explain how the Ably platform is designed with fault tolerant approaches to uphold its dependability guarantees.

Paddy Byers — Ably

  • 信頼性とフォールトトレランスの概念と、Ably社のプラットフォームが信頼性の保証を維持するためにフォールトトレラントアプローチを使用してどのように設計されているかを、以下項目に沿って解説している。
    • Architectural approaches to achieve reliability
    • Stateful role placement
    • Detect, hash, resume
    • Channel persistence layer
    • Implementation considerations
    • Consensus formation in globally-distributed systems
    • Health is not binary
    • Resource availability issues
    • Resource scalability issues
    • Conclusion
Phishing complaints cause Notion outage

More details on the Notion outage mentioned here last week. Complaints of phishing by a Notion user resulted in their registrar pulling their domain name out of DNS.

Peter Judge — Datacenter Dynamics

  • タイトル通り、コラボレーションアプリの「Notion」が先週何時間もオフラインになった障害がフィッシングに関する苦情が原因だったとして、解説をしている記事。
What Is True Resilience? (Hint: It’s Not About Managing Risk)

Google has three guiding principles for improving resiliency:

* Create maximum observability of the overall system
* Design for effectiveness, not perfection
* Learn and iterate as you go

Will Grannis — Google

  • タイトルの内容を下記3つのポイントに沿って解説しているForbesの記事。
    1. Create maximum observability of the overall system
    2. Design for effectiveness, not perfection
    3. Learn and iterate as you go
  • タイトル投げ掛けを以下の文言で強調している。
    • True resilience isn't about managing a particular instance of risk, but being ready for anything through the way you operate.
4 Things you Need to Know about Writing Better Production Readiness Checklists

Better Production Readiness Checklists This is an awesome guide to writing a production-ready checklist — and why you’d want one.

Emily Arnott — Blameless

  • タイトルに沿って以下のポイントを解説している。こういった指針があるとドキュメント作成が捗って良い。
    • How to make a production checklist
    • Why production checklists are helpful
    • Keeping your checklist up to date
    • How Blameless can help integrate your checklists
Fix Fast for finding and fixing regressions

Facebook found that as a regression is discovered later, it will take much longer to deploy a fix. With a combination of heuristics and machine learning, they’re detecting regressions earlier and bringing them to the attention of folks that can fix them.

Jian Zhang and Brian Keller — Facebook

  • Facebook社の抱えていた課題と、この課題に対処するため2019年に開始した「Fix Fast」と呼ばれる部門横断的な取り組みを解説している。

Outages

上記各社の障害情報


KubeWeekly #252 February 26th, 2021


The Headlines

Editor’s pick of the highlights from the past week.

CNCF Provides Insights into Secrets Management Tools with Latest End User Technology Radar

CNCF

This week, CNCF announced the findings of the fourth CNCF Technology Radar, a guide to a set of emerging technologies based on the experience of the CNCF End User Community. The theme of this edition was secrets management, which was identified by the consumers of cloud native technologies as an essential technology to consider in cloud distributions.

  • CNCFが4つ目となるCNCF End User Technology Radarの「Secret Management」をリリースしたことを紹介している。今回のRader TeamのYouTube動画も埋め込まれているので、良かったらチェックを。
  • 今回のRaderのテーマは下記の4つ。
    1. Vault has the broadest adoption across many companies and industries.
    2. After Vault, groups tend to use the native solutions provided by their public cloud provider.
    3. Certificate manager has become a popular choice in the Kubernetes ecosystem.
    4. Other solutions in the space are fragmented across various levels of maturity and complexity.

The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

Kubernetes admission controllers in 5 minutes

Kaizhe Huang, Sysdig

How we minimized the overhead of Kubernetes in our job system

Lally Singh and Ashwin Venkatesan, Datadog

  • タイトルの通りDatadog社が既存のジョブシステムをKubernetesに移行した際にオーバーヘッドにより発生したパフォーマンス低下をどのように解決したかについて解説している。
How we use Kubernetes at Asana

Tony Liang, Asana

  • Asana社がKubernetesで解決しようとした問題と、最初にKubernetesを使用したときにいくつかの問題点に遭遇しKubernetesアプリケーションの作成と保守を標準化するためのフレームワークを構築した「KubeApp」フレームワークで問題解決を行った方法を解説している。
Cutting build time in half with Docker’s Buildx Kubernetes Driver

Jeremy Kreutzbender, Release

  • タイトルに沿って、最初に元のインフラストラクチャがどのようになっていたかとサンプルプロジェクトでのビルドにかかった時間を、次に「buildx」を使用するために行った変更と観察された速度の向上を解説している。
Comparing Kubernetes operators for PostgreSQL

Nikolay Bogdanov, Flant

  • クライアントからのニーズを満たし、KubernetesでRDSのようなマネージドソリューションを実装するために、最も人気のあるPostgreSQLオペレーターであるStolon、Crunchy Data、Zalando、KubeDB、StackGresの現在の状態を調査した内容を解説している。
Horizontal pod autoscaling

Puja Abbassi

  • HPA(Horizontal Pod Autoscaling)の解説のため、Kubernetesの自動スケーリング手法に入る前に、APIを介して利用できるさまざまなタイプのスケーリングの定義から始めている。
Sysdig contributes Falco’s kernel module, eBPF probe, and libraries to the CNCF

Loris Degioanni, Sysdig

  • SysdigのFalcoカーネルモジュール、eBPF Probe、およびライブラリのCNCFへのコントリビュートをアナウンス、解説している。
  • 今後、FalcoスタックのすべてのコアコンポーネントがCNCFの一部になる。
Manage Envoy Proxy using go-control-plane

Mahendra Bagul, Infracloud

  • go-control-planeを使用してEnvoyを管理する方法と理解を深めるためにすべきことを解説している。
The road to adopting Kubernetes in development

Wito Delnat

  • ローカルのKubernetesクラスターでの開発に向けた最初の一歩を踏み出すためのMacOS用のガイド。 Kubernetesマニフェストの設定方法は説明していないが、最初のハードルを克服するのに役立つ、とのこと。

Peter O’Neill, Ambassador Labs

  • 2週間前のKubeWeekly#250で取り上げた記事のリンク修正。気づいたらのなら、元のページも直しておくれよ。。。(#250のページのリンクを見に行ったら404エラーのまま。。。)
  • 気づいたら、KubeWeeklyの以前の下記editionがWebページにアップロードされていました。以前CNCFのAmbassadorでKubeWeeklyのEditorの一人であるSaiyam Pathakさんに投げ掛けたら動いてくれていたので、感謝を伝えておきました。

ICYMI: CNCF online programs this week

A weekly summary of CNCF online programs from this week.

CNCF End User Technology Radar, February 2021 – Secrets Management
  • 「The Headlines」で触れたタイトルのWebinarの案内。リンク先から動画に辿り着きづらいため再掲となるが、このWebinar動画は「Secret Management」から。
The Container Security checklist

Liz Rice @Aqua Security

  • Liz Rice氏の新しい「Container Security」本に含まれているチェックリストの概要と、実際に回避する必要のあるいくつかの潜在的な弱点を詳しく解説している。
This Week in Cloud Native: Fluent Bit updates and Stream Processing

Fluent Bit

  • 上記リンクから動画への導線が見当たらない。YouTubeにアップされているのを発見。
  • Fluent Bitの最新リリースでのパフォーマンスの更新、マルチワーカー/新しい暗号ライブラリ/ GeoIPなどの待望の機能などについて解説している。

The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

The smallest Kubernetes Cluster: scaling down to the edge

Sascha Haase, Kubermatic

  • Kubermatic社が構築したオープンソースのKubermatic Kubernetes Platformを紹介している。
  • エッジコンピューティングで何百万ものクラスターを解き放ち、それらを管理し、コントロールプレーンとワーカーノードが別々の場所で実行されている場合でも、同期を維持する方法に疑問が生じるユースケースを念頭に置いている。
Our take on internet access for virtual machines

Christian Bianchi, Giant Swarm

  • Azureの仮想マシンにインターネットアクセスを提供する方法はいくつか検討し、NATゲートウェイがコスト、柔軟性、デプロイの容易さ、および顧客フレンドリーの間の完璧なバランスであると考えている、と解説している。
Introducing GKE Autopilot: a revolution in managed Kubernetes

Drew Bradstock, Group Product Manager, Google Cloud

  • GKE AutopilotのGAを受けて紹介している記事。良さそう。
  • ページに埋め込まれている動画の以下のキーワードがインパクトあった。
    • Fully automated Kubernetes platform
    • Google is your node SRE
VIDEO: Is Kubernetes right for us?

Keith Townsend and Alex Ellis

  • Alex Ellis(Founder of OpenFaaS、CNCF Ambassador)氏とKeith Townsend(Co-Founder of The CTO Advisor)氏によるタイトルの内容の約1時間のディスカッション。
  • オープンソースのcreatorと、CTOのアドバイザーを務められている方の違う視点での切り口は面白かった。Hobby vs Business Endeavor、コロナの影響によるスパイクとクラウドプロバイダーの局所的なリソース枯渇など。

Upcoming CNCF Online Programs

Rethinking your company’s Cloud Security in the shadow of the SolarWinds attack
Amir Kaushansky and Leonid Sandler @ARMO
March 4, 2021
Register Now

This Week in Cloud Native (Livestream): Demystifying Kubernetes network policy
Thomas Graf @Isovalent
March 3, 2021 at 12:00 pm PT
Register Now

CNCF Online Programs Playlist on YouTube

Check out our playlist for more curated content you don’t want to miss! New content is added every Friday.

https://mcusercontent.com/3885586f8f1175194017967d6/images/3a0983b1-af58-4051-a983-85e87a6cde52.png


いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara