互联网是怎么搭起来的:一份硬件与软件的科普

你点一下浏览器,发生了什么?从你手指下的金属壳,到地球另一端的服务器机房,再到回包路上的每一根光纤、每一颗芯片、每一行代码——这篇把整条链路拆开看。
internetinfrastructurehardwaresoftwarenetworking

互联网不是"云"也不是"虚拟世界"。它是几百万公里的电缆 + 几千万台机器 + 几亿行代码, 按层级组装起来的物理实体。看清楚每一层的硬件和软件,你对很多新闻(海底光缆被切、机房宕机、芯片禁运)才会有真实的体感。

从一次点击开始

设想你在杭州的咖啡馆里,打开浏览器输入 google.com,回车。 0.3 秒后网页出现在屏幕上。这中间发生的事情,至少要经过:

你的手机/电脑
   ↓ Wi-Fi/4G
家庭/咖啡馆路由器
   ↓ 网线
小区光猫
   ↓ 入户光纤
小区光交接箱
   ↓ 接入网光缆
运营商城域网
   ↓ 干线光缆
省级核心网
   ↓ 国家级骨干网
出海光缆登陆站
   ↓ 跨太平洋海底光缆
美国登陆站
   ↓ 美国骨干网
Google 数据中心
   ↓ 内部交换机
某台具体的服务器

每一层都有专属的硬件和软件,下面一层一层拆。

第一层:终端设备

你手里的"上网工具"——手机、笔记本、平板、智能电视——本质上是一台带网络模块的计算机。它由几块关键硬件组成:

部件作用类比
CPU跑应用、跑操作系统大脑
内存(RAM)临时数据缓存工作台
存储(SSD/Flash)持久数据文件柜
GPU渲染画面、跑 AI视觉皮层
网络芯片(Wi-Fi/蜂窝/有线)把数据变成信号嘴和耳朵
屏幕 + 触控/键鼠与人交互表情和手

软件这边,操作系统是底座,应用跑在它上面:

应用层    浏览器、微信、抖音
系统服务  网络栈、文件系统、图形界面
内核      Linux / Windows NT / XNU(Darwin)
驱动      Wi-Fi 驱动、显卡驱动、触屏驱动
硬件      上面那张表里的所有东西

浏览器经常被低估——它是地球上最复杂的消费软件之一,自带 JS 引擎、渲染引擎、网络栈、安全沙箱。 Chrome 源码上千万行,体量超过很多操作系统。这也是为什么"打开网页"看似简单,背后软件量极大。

第二层:接入网(最后一公里)

终端要"出门",第一步是家庭/办公室局域网

  • Wi-Fi:用 2.4GHz / 5GHz / 6GHz 无线电波,理论 Wi-Fi 7 速率 30Gbps
  • 以太网线:双绞线(千兆/万兆)或更老的电话线
  • 蜂窝网络:手机塔(4G/5G/6G),靠运营商基站接入

设备方面:

设备作用
光猫(ONU)把入户光纤的光信号变成电信号
路由器给家里每台设备分配 IP、做 NAT
交换机多端口转发(家用通常和路由器集成)
基站(蜂窝)覆盖几百米到几公里范围的无线接入

软件层面,路由器跑的是精简版 Linux(OpenWRT、运营商定制固件),里面运行:

  • DHCP 服务(给每台设备分配 IP)
  • NAT(把家里的私有 IP 翻译成公网 IP)
  • DNS 转发(缓存域名解析结果)
  • 防火墙(拦端口、限速)

家里那个一两百块的路由器,软件复杂度其实赶得上 90 年代一台中型机—— 只是被压缩到一颗几美元的 ARM SoC 上。这就是"摩尔定律 + 开源"的复利效应。

第三层:传输网(中长距离)

数据离开你家以后,进入运营商网络。这一层的核心是光纤路由器—— 不过这里的"路由器"和家用的完全不是一个量级。

光纤:互联网的物理底盘

  • 一根头发粗细的玻璃丝,单根可传 10–100 Tbps
  • 信号是激光,1310nm / 1550nm 波长在玻璃里损耗最低
  • 每隔 80–100km 要放一个**光放大器(EDFA)**给信号充能
  • 现代干线用 WDM(波分复用):一根光纤里同时跑几十个不同波长的激光,相当于几十条独立线路

关于光纤为什么重要,单独一篇 光纤对于互联网的作用 详谈。

城域网与骨干网设备

设备端口速率部署位置
接入交换机1–10 Gbps小区机房
汇聚路由器100 Gbps城区中心
核心路由器400 Gbps – 1.6 Tbps省级、国家级
光传输设备(OTN/DWDM)多波长干线和长距离

这些设备的单台造价从几万人民币到几千万人民币不等。 华为、思科、Juniper、中兴、诺基亚是主要供应商。

软件这层的主力协议:

  • IP:负责寻址和分组转发
  • BGP:互联网"路由表"的全球同步协议,决定流量怎么从 A 国到 B 国
  • MPLS / Segment Routing:运营商内部的高效转发
  • OSPF / IS-IS:单个自治域内的路由计算

BGP 是互联网"最危险的协议"之一——它假设所有运营商都不撒谎。 历史上多次出现某个小运营商配置错误("BGP 劫持")导致全球部分流量错走他国。 例如 2008 年巴基斯坦电信"屏蔽 YouTube"操作失误把整个 YouTube 流量黑洞了 2 小时。

第四层:跨国传输(海底光缆 + 卫星)

全球互联网超过 99% 的数据靠海底光缆传输,卫星只承担小于 1%。

海底光缆

  • 全球约 550 条 海底光缆,总长 140 万公里(绕地球 35 圈)
  • 单条光缆通常 4–24 对光纤,容量 10–400 Tbps
  • 寿命 25 年左右,故障率约一年几十次(被锚、拖网、鲨鱼咬伤、地震)
  • 主要由 SubCom、Alcatel Submarine Networks、NEC、HMN Tech(华为海洋)建设

中国主要的出海口:

登陆站主要光缆方向
上海崇明跨太平洋(北美)、东南亚
山东青岛日本、韩国
福建汕头东南亚、中东
海南三亚东南亚、非洲、欧洲

卫星互联网

  • 传统地球同步轨道(GEO):3.6 万公里高,延迟 600ms+,只适合广播电视
  • 低轨星座(LEO):500–1200 公里高,延迟 30–50ms,可跑实时业务
  • Starlink(SpaceX)已部署 7000+ 颗,OneWeb、Kuiper、中国"千帆星座"在跟进

海底光缆和低轨卫星不是替代关系,是互补:光缆容量碾压卫星几个数量级(成本/比特更低), 卫星的优势在于没基础设施的地方也能用(船舶、飞机、偏远山区、战场)。

第五层:数据中心

数据走到目的地,最终落在一座数据中心里。这是互联网最实体的部分。

一座现代数据中心长什么样

  • 占地:几万到几十万平方米(足球场量级)
  • 机柜数:几千到几十万个
  • 服务器数:几十万到几百万台
  • 耗电:几十兆瓦到上百兆瓦(一个小城市的用电量)
  • 冷却:风冷为主,AI 数据中心已转向液冷甚至浸没式冷却

服务器与存储

机柜里塞满的"机器"主要分几类:

类型用途代表配置
通用服务器Web 服务、数据库、API2× 64 核 CPU + 1TB 内存 + NVMe SSD
GPU 服务器AI 训练 / 推理8× H100 / B200 GPU + 1.5TB 内存
存储节点大容量数据36× 20TB HDD 或 24× 30TB SSD
网络设备内部交换Spine/Leaf 拓扑,单口 400G/800G

数据中心之间也要互联

大公司通常运营多区域多机房

  • 同城多可用区(AZ):抗机房级故障
  • 跨区域 / 跨大洲:抗地震、抗政策风险
  • 各机房之间用专线骨干网(Google 的 B4、AWS 的 Backbone)连接,自带专属光缆

这就是为什么"云"听起来虚,但它实际上是 Google / AWS / Azure / 阿里 / 腾讯 / 华为 这几家公司在全球花了上千亿美元盖出来的物理设施。 你按月几十块钱付的云费用,对应的是这套实体网络的一小片分时使用权。

软件全景:让硬件变成"互联网"

硬件本身只是金属和玻璃。把它变成"互联网"的,是几层堆叠的软件。

协议栈(TCP/IP 模型)

应用层  HTTP/HTTPS、DNS、SMTP、SSH、QUIC
传输层  TCP(可靠)、UDP(快)
网络层  IPv4 / IPv6 + 路由协议(BGP / OSPF)
链路层  以太网、Wi-Fi、4G/5G
物理层  电信号、光信号、无线电波

详见序号 1 文章互联网进化史里 TCP/IP 的故事。

关键基础设施服务

服务作用没了它会怎样
DNS域名→IP只能记 IP 上网
CDN内容分发海外网站打开慢 10–100 倍
证书机构(CA)HTTPS 加密身份浏览器一直报警告
时间同步(NTP)全网时钟一致TLS 失败、日志错乱
BGP / 路由全球路径选择跨运营商互通中断

应用层组件

实际跑业务的软件,常见的组合:

浏览器/App  →  CDN/边缘节点  →  负载均衡  →  Web 服务器
                                                ↓
                                            应用服务器
                                                ↓
                                     ┌──────────┼──────────┐
                                     ↓          ↓          ↓
                                  数据库   缓存(Redis)  消息队列
                                                ↓
                                          对象存储 / 文件系统

每一层都有几十种产品在竞争:Nginx vs Caddy、MySQL vs PostgreSQL、Redis vs Memcached…… 但整体架构 20 年没怎么变——这也是互联网工程师能跨公司复用经验的原因。

一次访问的全链路(再来一遍,配上软件)

把硬件和软件拼起来,刚才那个 google.com 的故事可以重写一次:

1. 浏览器                         →   解析 URL,找本地 DNS 缓存
2. 操作系统网络栈                 →   向 DNS 服务器发查询(UDP 53)
3. Wi-Fi 网卡 → 路由器 → 光猫     →   信号沿光纤进运营商
4. 运营商 DNS(或公共 DNS 8.8.8.8)→  返回 Google 服务器 IP
5. 浏览器与该 IP 建立 TCP 连接    →   三次握手(SYN/SYN-ACK/ACK)
6. TLS 握手                       →   交换证书、协商加密密钥
7. HTTP/2 请求                    →   GET / HTTP/2
8. CDN 边缘节点(如果命中缓存)   →   直接返回 HTML
9. 否则回源数据中心               →   走 Google 内部负载均衡
10. 应用服务器                    →   查数据库 / 缓存,生成 HTML
11. HTML/CSS/JS 一路返程          →   反向走完上述链路
12. 浏览器渲染                    →   解析 HTML、跑 JS、绘制像素到屏幕

0.3 秒内走完这 12 步,每一步都涉及多层硬件 + 多层软件协同。 没有任何一层是奢侈的——少一层链路就会断。

你下一次抱怨"网怎么这么慢"时,可以猜猜慢在哪一层: 延迟主要在第 1、5、6、9 步;带宽瓶颈通常在第 3 步(接入网)或第 11 步(CDN 边缘); 完全打不开通常是第 4 步(DNS 污染)或第 8 步(被 BGP 拦截)。

把这张图记进脑子里的好处

理解硬件 + 软件全景的实用价值:

  1. 看新闻不再迷糊——"红海光缆被切""日本机房断电""芯片禁运"分别对应哪一层、影响多大,你都能定位
  2. 职业选择更清楚——硬件工程师、网络工程师、运维、后端、前端、算法,对应的是哪一段链路一目了然
  3. 故障排查思路有了——网页打不开?从终端→Wi-Fi→DNS→TCP→应用,逐层排查比乱猜快几倍
  4. 对"自主可控"有判断——哪些层中国已经做得不错(5G 基站、光通信、整机),哪些层还卡脖子(高端芯片、操作系统内核),不会被各种叙事带偏

三个延伸的疑问

剩下三个问题,每一个都值得一篇文章单独讲:

一句话总结

互联网 = 几百万公里玻璃丝 × 几亿台芯片 × 几亿行代码。 每一次"在线",都是这三样东西按 TCP/IP 协议协同工作的一瞬间。 它不在云端,它在你脚下的电缆、楼顶的天线、地球另一头的机房里—— 看清这一点之后,互联网就不再是"魔法",而是一台可以被理解的巨型机器

延伸阅读