運び屋 (A carrier(forwarder) changed his career to an engineer)

Network / Cloud Native / Kubernetes / コンテナー / SRE / DevOps

SRE / DevOps / Kubernetes Weekly Reportまとめ#1(2/2~2/8)

この記事は2020/2/2~2/8に発行された下記3つのWeekly Reportを読み、備忘録兼リンク集として残したものです。

  • 誰かの情報源や検索工数削減などになれば幸いです。
DEVOPS WEEKLY ISSUE #475 February 2nd, 2020
SRE Weekly Issue #205 February 3rd, 2020
KubeWeekly #202 February 7, 2020

English Version of this blow is here.

  • この記事を読んで疑問点や不明点があれば、URLから本文をご確認の上、ご指摘頂ければ幸いです。
  • 理解が浅いジャンルも、とにかくコメントする様にしていますので、私の勘違いや説明不足による誤解も多々あろうかと思います。
  • 情報量が多いので文字とリンクだけに絞っております。
  • 各レポートで取り上げられている記事には2019年のものもあり、必ずしも最新のものという訳ではない様です。

DEVOPS WEEKLY ISSUE #475 - 2nd February 2020

News


For lots of people in large organisations, the CIO is the top role on the IT side. But the expectations, and the environment, are changing. This post explores the changing role of the CIO in response.
  • 新たな種類のテックリーダーとしてのCIOにモダンなビジネスが求めるものを、3つの全体的なトランフォーメーションにおけるベクトルと、変革を起こすCIOの5つの特徴を軸に話しています。
A good talk on Kubernetes security, dipping into several tools but mainly showing the nature of a few specific exploits and giving tips to avoid common problems,
  • いかにセキュアに(あるいはセキュアではない)コンテナ化について、記憶に残りやすい大量のイメージと共に説明しています。
The start of a series of posts implementing a container manager/runtime, in order to better understand the relationship between high-level tools like Kubernetes and the containers that run on the operating system.
  • container manager(ランタイムインスタンスなど複数のものを制御するハイレベルのコンポーネントを筆者は呼んでいる)conmanの紹介を中心とした記事。デモあり。
A collection of 30 of the best technical talks from last year. Topics range from building reliable services to low-level linux features and global traffic management to testing in production.
  • 筆者が2019年の技術的なトークベスト30をまとめたもの。各トーク動画のリンクが 貼られていて、気軽に確認できます。そして、選ばれているだけあって良質なプレゼンばかりで、自身が詳しくないジャンルも聴きたくさせるものがあり、大変参考になります。
A look at some of the patterns of container evolution, in particular exploring the rise of microVMs, unikernels and container sandboxes.
  • 現状のコンテナの課題と将来について。将来に向けてMicroVMs、Unikernels、Container sandboxesを紹介。
A nice walkthrough of installing Cloud Foundry on Kubernetes, looking at the different tools available to do the job.
  • Cloud FoundryをKubernetes上で動かすツールとしてcf-operator、 Cloud Foundry Quarks、 Eirini、kubecfを紹介。kubecfの「今後に乞うご期待」といった感じのデモを行っています。

Jobs


Hiring DevOps engineers in Berlin & remotely, Arweave is a permanent information storage network, built on a new type of blockchain called a blockweave. They're working to solve the problem of the ‘memory hole’, as formulated by George Orwell in Nineteen Eighty-Four, by building the first data storage medium that truly never forgets. Arweave works by rewarding network participants for contributing hard disk space to the network, in a similar fashion to proof of work in Bitcoin and other cryptocurrencies. Contact jobs@arweave.org or apply at:
  • Stack Overflow上での採用情報ですね。Arweave社がDevOps職をベルリンで募集。

Tools


Rode looks like an interesting software supply chain tool. It provides for the collection, attestation and enforcement of policies, supported by Grafeas and Open Policy Agent.
  • Rodeの紹介。OPA(Open Policy Agent)とGrafeasがサポートするポリシーの収集、認証、実行を行うソフトウェアのサプライチェーンツールの様なもの。README.mdの図解が見やすい。
Service resilience requires both real-time incident response software and a robust incident management and IT ticketing tool. These common techniques and tools can help you enhance your VictorOps and ServiceNow integration – making incident management suck less:
  • VictorOpsとServiceNowのサービス連携の紹介。内容から見て2つのサービスの「統合」というよりも「連携」。Splunkの自社グループプロダクト(VictorOps)のSNOW連携紹介といった方がわかりやすいか。

  • 余談ですが、最近身近で聞こえてくる「ServiceNowをSNOWって略すのなんで問題」が英語でも上がっていて笑った。


SRE Weekly Issue #205 3rd February 2020

Articles


The Myth of the Blameless Retrospective

This article hints at the fact that blame and sanction (punishment) are two different things.

Bonus content: Dr. Richard Cook on blameless vs sanctionless retrospectives

Bob Reselman

  • SRE本にある「非難なきポストモーテム」と対比して「非難なき振り返りの神話」と題して書かれている記事。この文化が生きるのはGoogle、Etsy、そしてAirbnbなどの一部の会社に限られる。

  • 多くのIT企業ではレガシーなコードや文化であり、適用が困難。会社は非難する矛先を探している事を受け入れて、神話ではなく現実を生きろと説いています。

  • 盲目的に違う文化を取り入れようとする人々への牽制かな。

(A few) Ops Lessons We All Learn The Hard Way

here we have a few lessons in operations that we all (eventually) (have to) learn; often the hard way.

Jan Schaumann

  • 運用上の教訓が88個並べられていて、味わい深いです。
What are Service Level Objectives (SLOs)? Lessons Learned

I especially like the emphasis on reducing pager fatigue through thoughtfully selected SLOs.

Emily Arnott — Blameless

  • SLO(Service-Level Objective)s のメリットについて述べています。
Resilience Roundup – Four concepts for resilience and the implications for the future of resilience engineering

The four concepts, drawn from a paper by Dr. David Woods, are:

  • Rebound
  • Robustness
  • Graceful extensibility
  • Sustained adaptability

Thai Wood — Resilience Roundup

  • resiliency(回復性)についてのDr.David Woodsの記事をまとめて解説したもの。回復性を上記の4つのコンセプトにカテゴリー分けして説明。
How an Alleged "Space Strike" Beautifully Demonstrates Work-As-Imagined Versus Work-As-Done

Understanding the difference between work-as-imagined and work-as-done is critical to the reliability of a complex system.

Jaime Woo and Emil Stolarsky — The Morning Mind-Meld

  • NASAのミッション中に起きた90分の沈黙、「宇宙での反乱」と称された事件を題材に語っています。

  • 労働環境などに語っていますが、個人的には中々ピーンと来ず。なぜここに?
    ->「 NASAの件は、複雑なシステムを継続して運用するには絵に描いた餅ではなく現実的な設計をしないと運用が破綻する、という話では」「reliabilityを維持するための重要な観点を得られる話だと個人的には思いました!」との指摘を頂き、読み直しました。

  • 指摘頂いた通りの文脈で語られており、私の中で話が繋がらず読み込めていなかったのだと反省しました。おかげさまで理解が深まりました。@inductorさん、ありがとうございます!!

Tracking toil with SRE principles

There’s a useful survey in here if you’re trying to measure or track toil in your organization.

Eric Harvieux — Google

  • SREの原則にそってToilを定義し、追跡する方法の紹介。

  • 技術的/組織的な複雑性をToilとしない。

  • 先日TwitterのTLに流れてきたのでRetweet/読了済みでした。

Site Wide Memory Leak: An On-Call Story

A nice little debugging story hinging on a bug in an upstream library.

Sanket Patel

  • とあるオンコール当番の週末に異なるホストから頻繁にアラートを受け取るところから話が始まる。

  • 「メモリー使用率閾値超え」のアラートを引き起こしたMemory Leakと、その原因を突き止めて知見を得た週末

Outages


Pinterest
Microsoft Office 365 Sharepoint Online
TD Bank
Google Drive, Docs, Sheets, and Slides
Facebook and Instagram
Gandi

  • They posted a quite candid analysis, concluding that they’re not sure what went wrong.

上記の各社障害情報。Gandi社はありのままのポストモーテムが読めて興味深いです。


KubeWeekly #202: February 7, 2020

The Headlines

Editor’s pick of the highlights from the past week.

Congratulations to the newest TOC members!

Please help us in welcoming the newest members of the CNCF TOC including Katie Gamanji, Liz Rice, Saad Ali, Sheng Liang, and Justin Cormack.

Announcing the containerd Project Journey Report

CNCF

CNCF just released the containerd Project Journey Report, the fourth such report issued for CNCF graduated projects. This report attempts to objectively assess the state of the containerd project and how CNCF has impacted the progress and growth of containerd.

  • CNCFとしてGraduatedプロダクトに対する4つ目となるレポート、 CNCF containerd Project Journey Reportをリリース。

  • containerdの現状とCNCFが発展と成長にどの様にインパクトを与えたのか客観的に評価を試みた。

The Technical

Tutorials, tools, and more that take you on a deep dive into the code.

How to Develop and Debug Python Applications in Kubernetes with Okteto

Ramiro Berrelleza, Okteto

  • PythonベースのアプリをKubernetes上でOktetoを利用して開発、デバッグする話。

  • Oktetoは2019年からOSS化。エンタープライズ版もある。Kubernetes slackに#oktetoチャンネルあり。

DNS Lookups in Kubernetes

Karan Sharma, Zerodha

  • KubernetesにおけるDNSの仕組みを解説。現在のバージョンのデフォルトのCoreDNSを軸に。
Continuous Profiling Go applications running in Kubernetes

Gianluca Arbezzano, InfluxDB

  • 筆者は先日"Continuous profiling in Go with Profefe”という記事を書き、Continuous profiles infrastructure(コレクター、リポジトリ、保存用API、プロファイルの検索、クエリー)を提供する新しいOSSであるProfefeを紹介。筆者もコントリビュートしている。

  • 上記記事により情報が載っているが、気にせずこの記事をこのまま読んでもらって構わない模様。

A bit of Istio before tea-time

Alex Ellis, OpenFaaS

  • Istioのデモ(パブリックIPアドレス、自身のラップトップ利用)がティータイム程度の短時間で実行可能。
Latest Jepsen Results against etcd 3.4.3

Xiang Li, Alibaba Group

  • Jepsen社がetcd 3.4.3をテストと分析を行い、良い結果や有益なフィードバックをetcdのチームに共有を行った。

  • レポート全体を見たい場合はこちらから。

Konveyor: Open Source, Migration Assistance for Kubernetes

Konveyor Project

  • 既存のアプリをKubernetesに移行するOSS Konveyorの紹介。
  • シンプルな説明とGitHub、Forum、Slack、Get Startedのリンク。Get Startedは作りかけかな?
Troubleshoot Kubernetes with the power of tmux and kubectl

Abhishek Tamrakar, Opensource.com

  • kubectlとtmuxを利用したトラブルシューティングの紹介。
  • Aliasの提案。kubectlとオプションの組み合わせで使うコマンド操作の簡素化に有用なaliasをまとめたリポジトリから。


Load balancing and scaling long-lived connections in Kubernetes

Daniele Polencic, LearnK8s

  • Kubernetes上で提供されていないlong-lived connectionsのスケールと負荷分散をする方法の提案
Emit Datadog monitors based on Kubernetes state

Astro is an operator that emits Datadog monitors based on Kubernetes state.

  • KubernetesのOperatorであるAstroのGitHubレポジトリーのリンク。
  • 詳細はREADME.mdを参照。

The Editorial

Articles, announcements, and morethatgive you a high-level overview of challenges and features.

GitLab, with Marin Jankovski

Craig Box and Adam Glick, Kubernetes Podcast from Google

  • Google社のメンバーが基本毎週ホストしているKubernetes Podcast。
  • GitLab社のEngineering ManagerであるMarin Jankovskiがゲスト。
  • News of the weekは先週分も含めてKubeWeekで取り上げているニュースが多いかな。
HPE acquires zero-trust networking, security firm Scytale

Charlie Osborne, ZDNet

  • HPE(Hewlett Packard Enterprise)社のScytale社の買収。
  • HPE社の発表はこちら。SPIFFE Meetupに過去2回参加している事もあって興味深い。ゼロトラストネットワーキングは理解を深めていきたいジャンル。
Run Windows Server Containers on GKE

Tim Anderson, The Register

  • GKEで現在ベータ版のWindowsサーバーコンテナのサポート、先日発表されたConfig Connectorに触れ、Google社や周辺の動きを分析しています。

Kubestone – Kubernetes & OpenShift performance benchmarking

Kubestone is a benchmarking Operator that can evaluate the performance of Kubernetes installations.

  • Kubernetes上のインストールにおけるパフォーマンスのベンチマークに使用するオペレータ、Kubestoneの紹介。
  • 件名にOpenShift入っているけれども、本文と資料での言及が見当たらず。。。

Kubernetes’ Inevitable Takeover of the Data Center

Scott Fulton III, DataCenter Knowledge

  • DCK(Data Center Knowledge)として、Kubernetesをデーターセンターに取って代わる最も破壊的なテクノロジーと捉え、登場と過去数年の動向を注意深く分析した特集。

If You’ve Got It, Flaunt It — Kubernetes Experience, That Is

Sydney Sawaya, SDxCentral

  • Kubernetesを扱えるエンジニアの需要と、供給のギャップとCNCFのトレーニングについて軽く触れている

  • タイトルでは「Kubernetesの経験、スキルを獲得すると誇示したくなるもの、状況である」という事を筆者の表現で伝えている。

Kubernetes Operators: 4 facts to know

Kevin Casey, The Enterprisers Project

  • 真の自動化を知ってこそコンテナの全ポテンシャルを悟る事ができる。そこでKubernetesのOperatorが役割を増してきている。
  • ITリーダーとしてOperatorに関して知っておくべき4つの事を述べている。
Register Now: KubeCon + CloudNativeCon EU Day Zero Events

Kim McMahon, CNCF


How Frame.io Built a Full Security Program Around Its Video Cloud with Falco

CNCF

  • Frame.ioがいかにFalcoを使ってNetFlix、Fox Sportsなどの最も優れた映像 / 映画のクリエイターが利用するプラットフォームを作ったのか。
  • 事例の詳細はこちら


いかがでしたか?気になる記事はありましたか? 私もまだ内容を咀嚼出来ていないものが多々ありますので、この備忘録兼リンク集を活用しながら理解を深めていきたいた思います。

では、また。

Bye now!!

Yoshiki Fujiwara