[爆卦]Kube-proxy iptables是什麼？優點缺點精華區懶人包

雖然這篇Kube-proxy iptables鄉民發文沒有被收入到精華區：在Kube-proxy iptables這個話題中，我們另外找到其它相關的精選爆讚文章

在 kube-proxy產品中有6篇Facebook貼文，粉絲數超過2,850的網紅矽谷牛的耕田筆記，也在其Facebook貼文中提到，關鍵字: conntrack, DNS, CoreDNS-autoscaler 影響: 部分正式生產環境崩壞整個問題是簡單來說就是正式叢集再不預期的情況下，發生了 DNS 的問題，導致內部服務大概有 15000 筆 query 失敗。造成錯誤的原因是因為 kube-proxy 沒有順利地去移除過...

　同時也有10000部Youtube影片，追蹤數超過2,910的網紅コバにゃんチャンネル，也在其Youtube影片中提到，...

kube-proxy 在矽谷牛的耕田筆記 Facebook 的最佳解答

2021-03-08 01:01:43
有 43 人按讚

關鍵字: conntrack, DNS, CoreDNS-autoscaler
影響: 部分正式生產環境崩壞

整個問題是簡單來說就是正式叢集再不預期的情況下，發生了 DNS 的問題，導致內部服務大概有 15000 筆 query 失敗。造成錯誤的原因是因為 kube-proxy 沒有順利地去移除過期的 conntrack，導致有些 DNS封包被導向到一個已經不存在的Pod。

這個問題的發生前提是，因為某些情境的發生，譬如系統負載過低， CoreDNS-autoscaler 就被觸發起來，將運行的 Pod 數量從三個降為兩個。所以系統上能夠處理 DNS 的Pod剩下兩個，但是如果有節點上的 conntrack 沒有順利清理乾淨，導致所有的封包都被導向那個被刪除的 CoreDNS，問題就這樣發生了。

詳細的過程跟一些學習重點可以參考原文

註:想要掌握 kubernetes 網路，對於 conntrack 的認識絕對不可以少，有太多太多的問題都跟 conntrack 有關，從 race condition, max 等眾多選項都牽扯所有運行的封包。有時間的話一定要好好的複習一下 conntrack 的概念

https://medium.com/preply-engineering/dns-postmortem-e169efd45afd
kube-proxy 在矽谷牛的耕田筆記 Facebook 的最讚貼文

2020-12-16 06:04:20
有 65 人按讚

這是一篇幻想文，幻想如果你可以重新設計 Kubernetes，你會希望有什麼樣的改動。也因為是幻想文，所以以下所提的東西不一定真的可以實作，也沒有考慮實作上可能會有什麼困難。原文非常的長，所以這邊就稍微列出一些內容

# 前提
作者(David Anderson, MetalLB 的主要貢獻者)認為 Kubernetes 真的很複雜，從 MetalLB 的開發經驗來看，幾乎無法開發出一個永遠不會壞且與 k8s 整合的軟體。
k8s 發展快速，一些不相容的修改也很難除錯，往往導致這些整合應用程式一起壞掉。
此外，作者使用 GKE 的經驗讓他覺得就算是這些k8s專家，也很難大規模環境中平安順利的使用 k8s.

作者認為 k8s 就像是管理平台內的 c++，功能非常強大，什麼都可以做，但是它會一直傷害你，直到你奉獻餘生該領域內。
作者期盼有一天，可以出現一個像是 go 語言的管理平台，簡單，優雅，容易學習

接下來就來看一下如果時光倒流，作者會希望 k8s 有哪些功能

# Mutable Pod
不像其他的資源一樣， Pod 這個資源基本上是不能修改的，有任何的更動都需要先刪除，後重新部署這樣兩步走來處理。
作者希望可以有一種 Pod 是可以支援即時修改的。
舉例來說，我透過 kubectl edit 修改了 Pod Image，然後只要透過 SIGTERM 送給 Runc 底層容器，然後當該 Container 被重啟，就會使用新的設定。這一切的發生都在同一個 Pod 的資源內，而不是重新產生一個新的 Pod

# Version control all the things
當 Pod 可以修正後，下一個作者想要的功能就是基於 Pod 本身的 Rollback。這意味希望叢集內可以有這些資訊可以去紀錄每次的變化

為了實現這個功能，可能每個節點上面也要去紀錄過往的所有 image 版本資訊，並且加上 GC 等概念來清除過期或是太舊的內容

# Replace Deployment with PinnedDeployment
相對於 Deployment， PinnedDeployment 最大的改動就是一個 Deployment 內可以同時維護兩個版本的 Pod。

舉例來說，我今天要將 Nginx 從 1.16 升級到 1.17，我可以透過 PinnedDeployment 去部署 Nginx，其中 1.16 佔了 60% ，而新版本 1.17 佔了 40%。

當一切轉移都沒有問題後，可以逐漸地將新版本的比例遷移到 100% 來達成真正的移轉。
原生的 Deployment 要達到這個功能就要創建兩個 Deployment 的物件來達到這個需求。

# IPv6 only, mostly
作者期望能的話，想要把 k8s networking 內的東西全部移除，什麼 overlay network, serivce, CNI, kube-proxy 通通移除掉。

k8s 全面配置 IPv6，而且也只有 IPv6，通常來說你的 LAN 都會有 /64 這麼多的地址可以分配 IPv6，這個數量多到你根本不可能用完 (2^64)。
也因為都有 public IPv6 的緣故，所有的存取都採用 Routing 的方式，封裝之類的玩法也不需要了。

文章內還提了很多東西，譬如說如果今天真的需要導入 IPv4 於這個純 IPv6 的系統上，可以怎麼做，如何設計 NAT64 等，算是非常有趣的想法

# Security is yes
作者認為安全性方面要最大強化，預設情況下要開啟 AppArmor, seccomp profile 等控管機制，同時也要全面禁止用 Root 來運行容器，基本上就是用非常嚴格的方式來設定安全性方面的規則。

目前 Kubernetes 內的資源， Pod Security Policy 非常類似作者想要完成的東西，通過這種機制確保所有部署的 Pod 都會符合這些條件。唯一美中不足的是 Pod Security Policy 也不是預設就有的規則。

# gVisor? Firecracker?
從安全性考量出發，是否預設改使用 gVisor 或是 Firecracker 這類型的 OCI Runtime 而非 Runc，同時搭配上述的各種安全性條件來打造非常嚴苛的運行環境

# VMs as primitives
是否可以讓 kubernetes 同時管理 container 以及 virtual machine，也許就會像是將 kubevirt 變成一個內建的功能，讓 kubernetes 更加靈活的使用

除了上面之外，文章內還有許多其他的想法，但是內容都滿長的，如果有興趣的可以點選下列連結參考看看
https://blog.dave.tf/post/new-kubernetes/
kube-proxy 在矽谷牛的耕田筆記 Facebook 的最佳貼文

2020-12-15 01:00:09
有 33 人按讚

最近跟大家分享一個 2020 年初左右的問題，這個問題的徵狀使用者透過 service 去存取相關服務時，會一直遲遲連接不上，直到 63 秒後服務才會通。
這個問題有兩種類型，一個是 63 秒後服務會通，一個則是 1 秒後會通，兩個背後的原因都一樣，這邊就來稍微簡介一下這個問題

# 發生條件
1. 使用 VXLAN 作為底層 Overlay Network，最常見的就是 Flannel 這套 CNI
2. Kubernetes 的版本不能太舊，至少要 1.16 以後，不過目前這個問題已經修復，所以現在要撞到除非特別指定版本
3. 使用的 Linux Kernel 版本也不能太新，目前該問題已經修復於大部分的 upstream

# 發生原因
1. VXLAN 本身是一個基於 UDP 的封裝協議，有一個已知的 bug 會使得其 checksum 發生錯誤，導致封包不會被遠端接收方給接收
2. kube-proxy 內關於 iptables 的設定沒有妥善，導致 VXLAN 封包會進行二次 SNAT
3. 第二次的 SNAT 就會觸發(1) 的 bug(當然還有其他條件，但是那些條件也剛好符合)
，最後導致封包的 checksum 不同，因此送到遠方就被拒絕
4. 底層的 TCP 建立連線時，會不停地嘗試，每次失敗都會等待更多時間，分別是1,2,4,8,16,32秒
5. 五次都失敗後， TCP 就會觸發重傳機制，下一次的重傳就不會進入到第二次的 SNAT，因此封包就不會踩到問題，因此通過

# 解決方法
1. 基本上這個問題要踩到要各方一起努力才會踩到，也因此修復方式也是多元化
2. Kernel 本身修復了關於 UDP 封裝的 Checksum 計算
3. Kubernetes 這邊則是針對 kube-proxy 進行強化，其使用的 iptables 規則會避免二次 SNAT 的情況

# 其他問題
1. 為什麼 TCP 重送後就不會踩到二次 SNAT? 這部分我看了相關的 issue 以及諸多文章都沒有看到解釋，都在探討 SNAT 後產生的 checksum，至於為什麼 TCP 重送後就通則是一個謎底
2. 為了解決這個謎體，我特別指定 kubernetes 版本並且重新編譯 Ubuntu 的 Linux Kernel 版本，盼望從 Kernel 中來觀察並且理解這個問題，目前已經有一些初步的進度。之後完成後會在撰寫文章跟大家分享這個問題

這個問題我認為非常有趣，也許自己的環境剛好沒有踩到，但是可以透過觀察不同的 issue 來研究各式各樣問題，也藉由這些過程來學習

相關 PR: https://github.com/kubernetes/kubernetes/pull/92035

kube-proxy 在コバにゃんチャンネル Youtube 的精選貼文

2021-10-01 05:19:08
kube-proxy 在大象中醫 Youtube 的最佳解答

2021-10-01 05:10:45
kube-proxy 在大象中醫 Youtube 的精選貼文

2021-10-01 05:09:56

[爆卦]Kube-proxy iptables是什麼？優點缺點精華區懶人包

雖然這篇Kube-proxy iptables鄉民發文沒有被收入到精華區：在Kube-proxy iptables這個話題中，我們另外找到其它相關的精選爆讚文章

同時也有10000部Youtube影片，追蹤數超過2,910的網紅コバにゃんチャンネル，也在其Youtube影片中提到，...

「kube-proxy」的推薦目錄

kube-proxy 在 矽谷牛的耕田筆記 Facebook 的最佳解答

kube-proxy 在 矽谷牛的耕田筆記 Facebook 的最讚貼文

kube-proxy 在 矽谷牛的耕田筆記 Facebook 的最佳貼文

kube-proxy 在 コバにゃんチャンネル Youtube 的精選貼文

kube-proxy 在 大象中醫 Youtube 的最佳解答

kube-proxy 在 大象中醫 Youtube 的精選貼文

你可能也想看看

搜尋相關網站

#1Oh my K8s service ! 談談Kube-proxy - 1 - iT 邦幫忙

#2kube-proxy | Kubernetes

#3Kubernetes NodePort and iptables rules | Ronak Nathani

#4手撕kube-proxy —— iptable模式实现原理实例分析 - 知乎专栏

#5Deep Dive kube-proxy with iptables mode - 磕磕绊绊的蜗牛

#6K8s: A Closer Look at Kube-Proxy - Better Programming

#7Comparing kube-proxy modes: iptables or IPVS? - Tigera

#8kube-proxy · Kubernetes指南 - Pengfei Ni

#9Kubernetes: Service, load balancing, kube-proxy, and iptables

#10Cracking kubernetes node proxy (aka kube-proxy)

#11kube-proxy would not update iptables rules when pod ...

#12kubernetes的Kube-proxy的iptables转发规则_田园园野的博客

#13iptables proxy mode in kube-proxy | by 顏鼎哲| Nov, 2020

#14IPTables vs IPVS in kubernetes - LinkedIn

#15深入理解kubernetes iptables proxy 模式_CloudNative 架構

#16How to find which mode kube-proxy is running in - Stack ...

#17Kubernetes without kube-proxy - FAUN Publication

#18Service 續集之Cluster IP、Kube-proxy、LoadBalancer - FuFu ...

#19kube-proxy中使用ipvs与iptables的比较 - 腾讯云

#20Configuring kube-proxy - OpenShift SDN default CNI network ...

#21kube-proxy - 中文文档

#22kube-proxy iptables_其它 - 程式人生

#23Kubernetes Tip: How Kube-Proxy Configures IPTables - Medium

#24IPVS, iptables and kube-proxy - Digi Hunch

#25Kubernetes Networking Demystified: A Brief Guide - StackRox ...

#26IPTABLES - The Kubernetes Networking Guide

#27简单示例说明kube-proxy 如何与iptables 配合使用 - 技术圈

#28Kube-Proxy Deep Dive - ZEVENET

#29kube-proxy iptables 模式源码分析 - 田飞雨

#30kube-proxy fails to create iptables routing (#3) · Issues - Repo ...

#31kube-proxy 模式对比：iptables 还是IPVS？ | 伪架构师

#32IPvS 學習手冊(二)

#33理解kubernetes环境的iptables - charlieroro - 博客园

#34Kubernetes 上的ExternalTrafficPolicy | Goofy's Blog

#35K8S kube-proxy iptables 原理分析 - 台部落

#36What are iptables? - Ambassador API Gateway

#37kubernetes的Kube-proxy的iptables转发规则_田园园野的博客

#38kube-proxy 如何與iptables 配合使用 - 中國熱點

#39kube-proxy iptables "nat" control flow - Google Drawings

#40iptables: How Kubernetes Services Direct Traffic to Pods

#41Kubernetes Without kube-proxy — Cilium 1.9.11 documentation

#42（譯）kube-proxy 模式對比：iptables 還是IPVS？ - 每日頭條

#43想知道kube-proxy 如何利用iptables 將連入Service 的流量轉送 ...

#44Network overview | Kubernetes Engine Documentation

#45Kube-proxy: iptables-nft... Rhel8 - issue with coredns - Reddit

#46Stopping IPTables is the only way to make Kubernetes cluster ...

#47Kubernetes kube-proxy iptables 模式深入剖析(一) - 掘金

#48How Linkerd uses iptables to transparently route Kubernetes ...

#49kube-proxy中使用ipvs与iptables的比较 - 墨天轮

#50Kubernetes学习笔记之kube-proxy service实现原理

#51iptables and ipvs - Programmer Sought

#52kube-proxy工作原理- IT閱讀

#53Kube proxy - Unofficial Kubernetes

#54Debugging Kubernetes Networking | EngineerBetter

#55kube-proxy的实现方式之iptables与ipvs模式 - Devops Roadmap

#56Proxy (kube-proxy) - Kubernetes Cookbook, 2nd Edition [Book]

#57kube-proxy currently incompatible with `iptables >= 1.8`

#58深入理解Kubernetes 网络模型：自己实现kube-proxy 的功能

#59IPVS从入门到精通kube-proxy实现原理

#60Three Key Elements and Implementation of Kubernetes ...

#61iptables is the best-available proxy, while ipvs has advantages ...

#62Tim Hockin on Twitter: "If *I* get confused by #Kubernetes ...

#631795416 – iptables sync sometimes taking too long - Red Hat ...

#64深入理解Kubernetes之：Service_Kubernetes中文社区

#65kubernetes 简介：kube-proxy 和service - iptables - 开源项目

#66kube-proxy模式选择容器云UK8S - 文档中心

#67梳理kube-proxy中iptables轉發規則 - MP頭條

#68v1alpha1 - pkg.dev

　同時也有10000部Youtube影片，追蹤數超過2,910的網紅コバにゃんチャンネル，也在其Youtube影片中提到，...

kube-proxy 在矽谷牛的耕田筆記 Facebook 的最佳解答

kube-proxy 在矽谷牛的耕田筆記 Facebook 的最讚貼文

kube-proxy 在矽谷牛的耕田筆記 Facebook 的最佳貼文

kube-proxy 在コバにゃんチャンネル Youtube 的精選貼文

kube-proxy 在大象中醫 Youtube 的最佳解答

kube-proxy 在大象中醫 Youtube 的精選貼文

#62Tim Hockin on Twitter: "If I get confused by #Kubernetes ...