運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#12(4/19~4/24)

この記事は2020/4/19~4/24に発行された下記3つのWeekly Reportを読み、備忘録兼リンク集として残したものです。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #486 April 19th, 2020
SRE Weekly Issue #215 April 20th, 2020
KubeWeekly #213 April 25th

English Version of this blow is here.

  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2019年以前のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #486 April 19th, 2020

News

Post-incident reviews are increasingly common, but how many of them focus on learning from incidents vs blame or simplistic understanding? This deck contains lots of tips for how to improve the practice.

  • タイトルは「Incident Analysis: How Learning is Different Than Fixing 」。
  • Speaker Deckの記事。タイトルに加え、現在の典型的な「インシデントから学ぶ」というアプローチがごくわずかしか実際の学びになっておらず、多くのインシデント後のドキュメントはファイルされる為に書かれており、読まれる為に書かれていないとの指摘から始まる。
  • 以前他の記事でも指摘されていた様に、インシデント数を減らす事にフォーカスしてしまうと、インシデントのカウント数を減らす方(報告方法や頻度などを通して)に力が働き、組織に悪影響をもたらすとの考察。
A detailed tutorial on how to build a GitHub Action. Covers everything from managing dependencies to testing and releasing the Action.
  • タイトルは「Releasing GitHub Actions」。1月31日付の記事。
  • GitHub Actionsを使った事が無い方は前の記事(2019年9月19日付け)、「Working with GitHub Actions」のチェックを勧めている。本記事はハンズオン形式で解説を読みながらできるので、私も手を動かして確認します。
A podcast recording (and handily notes) on microservices testing approaches, covering everything from bridging technology generations to the pros and cons of local tools vs remote/staging environments.
  • タイトルは「LOTE #3: Matt Klein on Testing Microservices and Building Cloud Platforms」。
  • Envoyのクリエイターであり、Lyft社のsoftware engineer であるMatt Klein氏がポッドキャストでマイクロサービスのテスト戦略について語った要点を文字起こししてある。下の方にポッドキャストが埋め込んであるので、本編も良かったらどうぞ。
An in-depth post on the need for coordination between operations and information security folks, looking at the benefits of organising games to improve coordination.
  • タイトルは「Shall We Play a Coordination Game?」。
  • 筆者が以前に書いた記事のタイトル通り「Security as a Productと協力を、行動経済学のゲーム理論の協力ゲーム、モラルハザードのコンセプトのレンズを通して両チームの関係を検討していく話。
  • 読むのに掛かる推定時間の「26 minutes」の表記を見た瞬間にだいぶ心を折られました。
A series of blog posts looking at the foundations of Open Policy Agent, and exploring the Rego policy language.
  • OPA(Open Policy Agent)のポリシー言語であるRegoを紹介している3部作のブログシリーズ。Part 2はこちらPart 3はこちら
  • OPAも深掘りしたいテーマ。これは宿題。
An opinionated take on API transports, comparing gRPC, OpenAPI and REST style APIs and when to choose which option.
  • タイトルは「API design: Understanding gRPC, OpenAPI and REST and when to use them」。
  • gRPC、OpenAPI、RESTを通してHTTPとRPC-style APIsの適合を検討している記事。私の前提知識と経験が浅い部分なので、後で読み返しかな。
A look at building a LinuxKit virtual machine to run on Azure, specifically for running container workloads.
  • タイトルは「Creating a minimal OS for containers with LinuxKit and Azure」。
  • LinuxKitとAzure環境を使って最小限のOSを作る話。筆者は「歴史的に、CanonicalやRed Hatの様な大きな会社でなければLinuxのディストリビューションは組み立てられないと思っていた。LinuxKitのおかげで劇的に障壁が低くなっている」と述べている。
A post on hosting your own Helm Chart repository on Google Cloud, using Terraform and CircleCI in the mix.
  • タイトルは「Creating a Helm repo on Google Cloud」。
  • 筆者は下記の課題を抱えていたので、解決すべく手を動かした話。
    • プラットフォームエンジニアとして新しいチャートバージョンを可能な限り迅速に全てのenvで入手可能にしたい
    • Helmリリースが起動時に落ちない
    • Helmリリースの依存性はクラスター外に保持される
If you find yourself writing or editing lots of Kubernetes YAML files in Vim this post is for you. It shows how to configure a language server to provide autocompletion and inline hints for the various properties.
  • タイトルは「Vim Kuberetes YAML Support」。
  • vimでKubernetesのYAMLファイルを書く際に補完とリソースの説明が入る様に設定できる。この内容のYouTube動画もリンクされているので、良ければどうぞ。デフォルトのスキーマがKubernetes 1.14.0 schemasだが、更新する方法が載っている。

Tools

Pomerium is an identity-aware proxy that enables secure access to internal applications, providing an interesting alternative to custom authentication systems and VPNs.
  • 内部アプリのセキュアなアクセスを可能にするIAP(identity-aware proxy)OSSツール「Pomerium 」のGitHubページ。ioページはこちら

SRE Weekly Issue #215 April 20th, 2020

Articles

Embracing the beautiful mess

The “messy” details of our human/computer systems is their hidden strength.
Lorin Hochstein

  • 往々にして人間/コンピューターのシステムが順序立って整っている事を理想とするが、実は整っていない事(オンコール当番と決まっている訳では無い人、Slackチャンネルにたまたま呼び寄せられた人の助力など)によって支えられている事などに言及し、messがシステムに必要な要素であると論じている記事。
Accident Case Study: Just a Short Flight

In this accident report, learn how two pilots lost situational awareness, with disastrous consequences.
Air Safety Institute

  • アメリカの飛行機墜落事故を題材にしたケーススタディー。
  • パイロットの技術、キャプテンの監督、飛行プランの打ち合わせなど突っ込みどころが沢山。ただ、どれもオペレーションを行う上で、近しい要素(状況認識の欠如/スキル不足/認識合わせ不足/適正)などで障害が起こるので、教訓としていく。
Succeeding With Service Level Objectives

Without a structured strategy, and careful consideration of the full SLO lifecycle, SLOs risk partial implementation. This can result in low ROI and, > in many cases, a complete failure.


Danny Mican — Squadcast

  • Auth0社のSenior SREであるDanny Mican氏によるIIDARRプロセスを使ってSLOを白紙から作る方法の紹介をしている記事。興味深いので、これもじっくり読み返したい。
  • IIDARRは以下の要素の頭文字から取ったもの。
    • Identify
    • Instrument(Measure)
    • Define
    • Alert (Action)
    • Report/Refine
Back to Basics: Why Global Infrastructure Matters

The cloud’s multiple availability zones and regions can be powerful, but it’s hard to get a multi-region architecture correct.
Serhat Can — OpsGenie

  • 筆者が見落とされがちなクラウドの信頼性を約束している側面である「Global Infrastructure」にフォーカスして解説している記事。
SLA Uptime calculator

A useful little JavaScript tool: plug in an availability percentage (e.g. 99.99%), and get back the number of minutes you can be down in a day, month, quarter, or year.
Hexadecimal

  • 「SLA Uptime calculator!」SLAを日/週/月/四半期/年単位で瞬時に計算できてメッチャ便利!
Hosted Pools Availability Degradation

Azure Pipelines had an incident of delayed builds at the end of March. Find out more in this post-incident analysis.
Chad Kimes – Microsoft

  • 3/24~3/26にパンデミック(コロナ)によりEUとUKで発生したWindows、Linuxエージェント向けのビルド、リリースで遅延に関するAzureのポストモーテム。
  • コミュニケーションの問題(監視設計の問題とも言えると思われる)で、初日10分で気付くべきところを5時間近く掛かったのは、想像すると胃が痛い。
Free Google Book: Building Secure and Reliable Systems

Google published another book in their SRE series. This short summary gives an overview of what’s inside along with an explanation of the motivation for another book. See also: Google’s announcement
Todd Hoff — High Scalability

  • Google社によるSRE本第3弾「Building Secure And Reliable Systems」がオンラインで無料公開されました!21章557ページ。これも輪読会をやりたい。
One Team at Uber is Moving from Microservices to Macroservices

The pendulum is swinging back, and folks are starting to see the downsides of a plethora of microservices, including early champions, Uber.
Todd Hoff — High Scalability

  • Uber社がマイクロサービスからマクロサービス(well-sized services)への移行をアナウンスした事から話は始まる。
  • 「信頼性とテスト性をマイクロサービスで気付くのは多くの人々が思うよりも難しい」「マクロサービスであり、モノリスでは無い。モノリポは必要かもしれないし、そうでないかもしれない。より良い可観測性とデバッグを」など、様々な示唆に飛んだ言葉が並んでいる。誤解や拡大解釈を避ける為、文脈はちゃんと読んだ方が良さそう。
  • 該当のツイートはこちら

Outages

上記各社の障害情報

KubeWeekly #213 April 25th, 2020

The Headlines

Editor’s pick of the highlights from the past week.

Kubernetes Podcast episode 100: Community Redux, with Paris Pittman

To celebrate the 100th episode of the Kubernetes Podcast from Google, hosts Adam Glick and Craig Box welcome back their first ever guest, Paris Pittman. Paris is an open source program manager at Google Cloud, member of the Kubernetes steering committee, and founder of the CNCF Contributor Strategy SIG and the Kubernetes contributor communication committee. Paris looks at how the Kubernetes community has changed and ways in which it has stayed the same, as well as how other projects can adopt learnings from Kubernetes.

Bundle Training and Certification to Jump Start Your Career

Dan Brown, The Linux Foundation

The Linux Foundation offers training and certification bundles, which provide the courses needed to gain the knowledge necessary to succeed in a chosen open source career, and a certification exam to enable you to confidently demonstrate that knowledge to potential employers. Bundles are the more direct way to get qualified for a new open source career, or add new skills to advance your current one.

And there is a sale! 30% off offer for all bundles, courses and certification exams. Use code ANYWHERE30 at checkout. LF also have nearly two dozen completely free training courses that are always available to help you get started and determine the open source technology area in which to focus.

  • CNCFが提供している4/6までのキャンペーンが4/30まで延長。
  • 対象は「トレーニング+資格試験」「トレーニング」「資格試験」が 30%OFF。クーポンコードは「ANYWHERE30」。

ICYMI: CNCF Webinars

Weekly recap of CNCF member and project webinars that you might have missed.
You can view all CNCF recorded and upcoming webinars here

CNCF Project Webinar: Announcing Open Source gRPC Kotlin

James Ward, Developer Advocate @Google Cloud Platform

  • 先週取り上げた記事「gRPC, meet Kotlin」でコントリビューターとして名前が上がっているGoogle社Developer AdvocateのJames Ward氏による、同アナウンスの翌日のWebinar動画。OSS化されたgRPC Kotlinプロジェクトの紹介と使い方の紹介。
  • 他のコントリビューターも参加してフォローし合っていて、チームとして良く機能してそうな雰囲気が伝わる。
CNCF Member Webinar: Ensuring compliance, without sacrificing development agility and operational independence, in K8s with OPA Gatekeeper

Sertaç Özercan, Software Engineer @Microsoft and Lachie Evenson, Principal Program Manager @Microsoft

  • Microsoft社のSoftware EngineerであるSertaç Özercan氏、同社のPrincipal Program ManagerであるLachie Evenson氏によるWebinar動画。
  • OPA(Open Policy Agent)のサブプロジェクトである「Gatekeeper」を「開発のアジリティー、運用の独立性を損なうことなく、コンプライアンスを担保する方法」として 紹介している。

  • KubernetesクラスターにカスタマイズできるAdmission WebhookでOPAで実行されるポリシーを適用するもの様です。

CNCF Member Webinar: Kubernetes RBAC 101

Oleg Chunikhin, CTO @Kublr

  • Kublr社のCTOであるOleg Chunikhin氏によるKubernetesにおけるRBAC(Role-Based Access Control)のコンセプトとオブジェクトについて解説しているWebinar動画。
CNCF Member Webinar: 如何让你的Windows应用运行在Kubernetes平台

杨雨 Alex Yang, 解决方案架构师 Solution Architect @Mirantis 张文墨 and Larry Zhang, 解决方案架构师 Solution Architect @Mirantis

  • Mirantis社のSolution ArchitectであるAlex Yang氏と同社の同ポジションのLarry Zhang氏による「中国語」のWebinar動画。日本語もここに並ぶ日が来ないかな〜。英語以外の言語がドンドン並んで行くと、多様性/裾野が広がって良いと思う。英語力を上げていっても、母国語の方が頭に残したり、表現しやすいのは確かなので(私の英語力、その他諸々のスキルでは)。

The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

kubesort

kubesort is a tool that helps you sort the results from kubectl get in an easy way

  • kubectl getの結果を簡単にソートするOSSのツール「kubesort」のGitHubページ。

  • 例えば、ポッドのステータスをソートする際にkubectl --sort-by=.status.containerStatuses[0].restartcount get po と打つ代わりにkubesort statusと打つだけで良い。json-pathを使って階層表現のソートをしなくて良い。

  • v0.1.0はkubectl get podのみ。ロードマップで、v0.2.0でDeployments、 services、namespacesも対応し、自動補完もできる様にしていく模様。

Videos: Intro to Vitess—its powerful capabilities and how to get started

Abhi Vaidyanatha, PlanetScale

Learn from our maintainer: build/run/test your Velero code locally and in cluster

Carlisia Campos, VMware

  • VMware社による「Velero codeをbuild/run/testする方法を同社のメインテイナーが解説していく」YouTube動画。ターミナルや手順が見易い。
Multicluster-Scheduler and Argo (Workflows and CD): a Deep Dive

Gokul Chandra

  • マルチクラスター、マルチクラスター環境に対応する構成を検討する為、Multicluster-Scheduler、Argo Workflows、Argo CD、Virtual-Kubelet、Ciliumなどを組み合わせたDeep Diveして解説している記事。
  • 解説、スクリーンショットなどが充実していて、内容が盛りだくさんですが通してやってみたい。宿題。
Virtual 4G Simulation Using Kubernetes And GNS3

Christopher Adigun, Loodse

  • KubernetesとGNS3を使って仮装4Gスタックをデプロイする記事。
  • 以前働いていた環境でGNS3は大変お世話になったし、ネットワーク周りは興味関心があるので、これもやってみたい。
Building a Kubernetes-Based Platform: Progressive Delivery, the Edge, and Observability

Datawire

  • 「Kubernetesが広く採用されてきた事により、他の下記3つのクラウドネイティブプラットフォームの土台となり、フルサイクルの開発を可能にしてきた」として解説している記事。
    • Continuous Delivery Pipelines
    • The Edge Stack
    • The Observability Stack
How GKE surge upgrades improve operational efficiency

Tamas Ragoncsa and Kobi Magnezi, Google

  • Google社による「GKE surge upgradeが運用効率性をいかに改善したか」を解説している記事。surge upgradeは4/20からデフォルトで有効になり、既存のノードプールに関しても今四半期中に移行する模様。
Rolling Updates and Blue-Green Deployments with Kubernetes and HAProxy

Nick Ramirez, HAPProxy

  • 2/11付けのHA Proxyによる「HAProxy Kubernetes Ingress Controller」を利用したローリングアップデートとBlue-Greenデプロイメントを行なっている記事。実行環境はMinikube
EKS Service Accounts Explained

Jason Smith

  • AWSが数ヶ月前にPodにIAMロールの割り当てができる様にした事をきっかけに筆者が実装するにあたって混乱した事、AWSが実際に行なった事、筆者が考える正しい点/間違っている点を述べている記事。

The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

Cornelia Davis and Liz Rice

  • Weaveworks社のCTOかつ「Cloud Native Patterns」の著者であるCornelia Davis氏がホストする新しいPodcast「The Art Of Modern Ops」の紹介記事。
  • ゲストとしてAqua Security VP Open Source EngineeringかつCNCFのTOC(Technical Oversight Committee)のChairであるLiz Rice氏がゲストに迎え、「Navigating the Kubernetes hype cycle」をテーマにしている。また聴きたいPodcastが増えた〜。早速サブスク。
Kubernetes architecture for beginners

Kevin Casey, Red Hat

  • 「Kubernetes事始めとしてKubernetesのアーキテクチャーの基礎、キーファクター」を解説している記事。
Pancake Podcast: Cassandra and the Kubernetes Data Plane

Joab Jackson, The New Stack

  • 「Kubernetesエコシステムにおけるデータープレーンの果たす役割は何か?」をテーマにパネルディスカッションをしているPodcast。
GigaOm Radar for Hosted Kubernetes Solutions

Enrico Signoretti, Gigaom

  • GigaOm社による「Hosted Kubernetes Solutions」のレポート。

  • 無料で見れるのは開いたページのレーダーとSummaryのみ。

Is Kubernetes becoming the driving force of enterprise IT?

Graham Berry, RedHat

  • 「エンプラ企業にとってKuberentesが推進力となっているか?」をテーマにKuberenetesの解説を行い、「ワールドクラスのサービスを顧客向けに作り、市場に今よりも速く投入するのなら、Kubernetesは武器になり得る」と述べている。
NetApp to make stateful applications easier to do in Kubernetes

Steven J Vaughan-Nichols, ZDNet

  • NetApp社がProject Astraを通してKuberenetesのストレージとコンテナープラットフォームにステートフルなアプリを導入し易くする為に行なっている取り組みの紹介記事。
The important things I know which helped me pass the CKAD exam

Vishwas Javalgekar

  • 「私がCKAD(Certified Kubernetes Application Developer)を取得する為に役立った重要な事」と題して、エリアスの利用、Grace period無しのリソース削除などのコツを紹介している記事。
Istio Service Mesh in 2020: Envoy In, Control Plane Simplified

Alon Berger, Alcide

  • Istioの2020年現在の動向と更新点を解説している記事。
Master Shifu & His Cloud-Native Mentoring Sessions

Vishal Biyani, Infracloud

  • カンフー・パンダ」をモデルに、シーフー老師などのキャラクターを通して、InfraCloud社の歴史と、クラウドネイティブ技術に興味のある学生/エンジニア向けにメンターシッププログラム「Talk-To-Us」を紹介している記事。

Upcoming CNCF webinars

気になるWebinarがあれば登録してチェックを。以下は直近のものとしてピックアップされていたものです。
Member webinar: Kuma: Service Mesh and the Future of Application Connectivity
Marco Palladino, Kong
April 28, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member webinar: KubeCarrier: the Operator of Operators
徐嘉诚 Jiacheng Xu, 软件开发工程师 Software Engineer @Loodse
This webinar will be delivered in Chinese.
April 29, 2020 10:00 AM China Standard Time
REGISTER NOW »

Member Webinar: Building Zero Trust based Authentication in Healthcare with SPIRE
Bobby Samuels, Vice President, AI Technology @Anthem, Inc.
Frederick Kautz, Head of Edge Infrastructure @Doc.ai
Emiliano Berenbaum, Chief Technologist, HPE Labs @Hewlett Packard Enterprise
(HPE) April 29, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member webinar: Best Practices In Implementing Container Image Promotion Pipelines
Baruch Sadogursky, Head of DevOps Advocacy @JFrog
April 30, 2020 10:00 AM Pacific Time
REGISTER NOW »

Community webinar: How to Conduct a GREAT Live Stream
Alex Lustenberg, Jorge Castro, Chris Short
April 30, 2020 1:00 – 3:00pm Pacific Time
REGISTER NOW »

Project webinar: Kubernetes 1.18
Kubernetes release team
May 1, 2020 9:00 AM Pacific Time
REGISTER NOW »

Member Webinar: How AWS uses Firecracker and Fargate to run serverless Kubernetes pods in Amazon EKS
Mo Ziyuan 莫梓元 解决方案架构师 @AWS
This webinar will be delivered in Chinese.
May 7, 2020 10:00 AM China Standard Time
REGISTER NOW »

Member webinar: Data Services for Cloud Native Workloads
Diamanti
May 12, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Piraeus: Dynamic Provisioning, Resource Management and High Availability for Local Persistent
Philipp Reisne, CEO @Linbit
Sun Liang, 资深存储架构师 @DaoCloud
Alex Zheng, 资深存储工程师 @DaoCloud
This webinar will be delivered in Chinese.
May 13, 2020 10:00 AM China Standard Time
REGISTER NOW »

Member webinar: Cloud Native Monitoring: Scaling Prometheus
Aaron Newcomb, Director, Product Marketing, Monitoring @Sysdig
Carlos Arilla Navarro, Technical Marketing Engineer @Sysdig
May 19, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member webinar: Kubernetes Cost Allocation Done Right
Webb Brown, Co-founder and CEO @Kubecost
June 24, 2020 10:00 AM Pacific Time
REGISTER NOW »

Member Webinar: Pivoting Your Pipeline from Legacy to Cloud Native
Tracy Ragan, CEO of DeployHub and CDF Board Member
June 30, 2020 10:00 AM Pacific Time
REGISTER NOW »

いかがでしたか?気になる記事や情報はありましたか?

私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいと思います。

では、また。

Bye now!!

Yoshiki Fujiwara