互联网是怎么搭起来的:一份硬件与软件的科普
你点一下浏览器,发生了什么?从你手指下的金属壳,到地球另一端的服务器机房,再到回包路上的每一根光纤、每一颗芯片、每一行代码——这篇把整条链路拆开看。互联网不是"云"也不是"虚拟世界"。它是几百万公里的电缆 + 几千万台机器 + 几亿行代码, 按层级组装起来的物理实体。看清楚每一层的硬件和软件,你对很多新闻(海底光缆被切、机房宕机、芯片禁运)才会有真实的体感。
从一次点击开始
设想你在杭州的咖啡馆里,打开浏览器输入 google.com,回车。
0.3 秒后网页出现在屏幕上。这中间发生的事情,至少要经过:
你的手机/电脑
↓ Wi-Fi/4G
家庭/咖啡馆路由器
↓ 网线
小区光猫
↓ 入户光纤
小区光交接箱
↓ 接入网光缆
运营商城域网
↓ 干线光缆
省级核心网
↓ 国家级骨干网
出海光缆登陆站
↓ 跨太平洋海底光缆
美国登陆站
↓ 美国骨干网
Google 数据中心
↓ 内部交换机
某台具体的服务器
每一层都有专属的硬件和软件,下面一层一层拆。
第一层:终端设备
你手里的"上网工具"——手机、笔记本、平板、智能电视——本质上是一台带网络模块的计算机。它由几块关键硬件组成:
| 部件 | 作用 | 类比 |
|---|---|---|
| CPU | 跑应用、跑操作系统 | 大脑 |
| 内存(RAM) | 临时数据缓存 | 工作台 |
| 存储(SSD/Flash) | 持久数据 | 文件柜 |
| GPU | 渲染画面、跑 AI | 视觉皮层 |
| 网络芯片(Wi-Fi/蜂窝/有线) | 把数据变成信号 | 嘴和耳朵 |
| 屏幕 + 触控/键鼠 | 与人交互 | 表情和手 |
软件这边,操作系统是底座,应用跑在它上面:
应用层 浏览器、微信、抖音
系统服务 网络栈、文件系统、图形界面
内核 Linux / Windows NT / XNU(Darwin)
驱动 Wi-Fi 驱动、显卡驱动、触屏驱动
硬件 上面那张表里的所有东西
浏览器经常被低估——它是地球上最复杂的消费软件之一,自带 JS 引擎、渲染引擎、网络栈、安全沙箱。 Chrome 源码上千万行,体量超过很多操作系统。这也是为什么"打开网页"看似简单,背后软件量极大。
第二层:接入网(最后一公里)
终端要"出门",第一步是家庭/办公室局域网:
- Wi-Fi:用 2.4GHz / 5GHz / 6GHz 无线电波,理论 Wi-Fi 7 速率 30Gbps
- 以太网线:双绞线(千兆/万兆)或更老的电话线
- 蜂窝网络:手机塔(4G/5G/6G),靠运营商基站接入
设备方面:
| 设备 | 作用 |
|---|---|
| 光猫(ONU) | 把入户光纤的光信号变成电信号 |
| 路由器 | 给家里每台设备分配 IP、做 NAT |
| 交换机 | 多端口转发(家用通常和路由器集成) |
| 基站(蜂窝) | 覆盖几百米到几公里范围的无线接入 |
软件层面,路由器跑的是精简版 Linux(OpenWRT、运营商定制固件),里面运行:
- DHCP 服务(给每台设备分配 IP)
- NAT(把家里的私有 IP 翻译成公网 IP)
- DNS 转发(缓存域名解析结果)
- 防火墙(拦端口、限速)
家里那个一两百块的路由器,软件复杂度其实赶得上 90 年代一台中型机—— 只是被压缩到一颗几美元的 ARM SoC 上。这就是"摩尔定律 + 开源"的复利效应。
第三层:传输网(中长距离)
数据离开你家以后,进入运营商网络。这一层的核心是光纤和路由器—— 不过这里的"路由器"和家用的完全不是一个量级。
光纤:互联网的物理底盘
- 一根头发粗细的玻璃丝,单根可传 10–100 Tbps
- 信号是激光,1310nm / 1550nm 波长在玻璃里损耗最低
- 每隔 80–100km 要放一个**光放大器(EDFA)**给信号充能
- 现代干线用 WDM(波分复用):一根光纤里同时跑几十个不同波长的激光,相当于几十条独立线路
关于光纤为什么重要,单独一篇 光纤对于互联网的作用 详谈。
城域网与骨干网设备
| 设备 | 端口速率 | 部署位置 |
|---|---|---|
| 接入交换机 | 1–10 Gbps | 小区机房 |
| 汇聚路由器 | 100 Gbps | 城区中心 |
| 核心路由器 | 400 Gbps – 1.6 Tbps | 省级、国家级 |
| 光传输设备(OTN/DWDM) | 多波长 | 干线和长距离 |
这些设备的单台造价从几万人民币到几千万人民币不等。 华为、思科、Juniper、中兴、诺基亚是主要供应商。
软件这层的主力协议:
- IP:负责寻址和分组转发
- BGP:互联网"路由表"的全球同步协议,决定流量怎么从 A 国到 B 国
- MPLS / Segment Routing:运营商内部的高效转发
- OSPF / IS-IS:单个自治域内的路由计算
BGP 是互联网"最危险的协议"之一——它假设所有运营商都不撒谎。 历史上多次出现某个小运营商配置错误("BGP 劫持")导致全球部分流量错走他国。 例如 2008 年巴基斯坦电信"屏蔽 YouTube"操作失误把整个 YouTube 流量黑洞了 2 小时。
第四层:跨国传输(海底光缆 + 卫星)
全球互联网超过 99% 的数据靠海底光缆传输,卫星只承担小于 1%。
海底光缆
- 全球约 550 条 海底光缆,总长 140 万公里(绕地球 35 圈)
- 单条光缆通常 4–24 对光纤,容量 10–400 Tbps
- 寿命 25 年左右,故障率约一年几十次(被锚、拖网、鲨鱼咬伤、地震)
- 主要由 SubCom、Alcatel Submarine Networks、NEC、HMN Tech(华为海洋)建设
中国主要的出海口:
| 登陆站 | 主要光缆方向 |
|---|---|
| 上海崇明 | 跨太平洋(北美)、东南亚 |
| 山东青岛 | 日本、韩国 |
| 福建汕头 | 东南亚、中东 |
| 海南三亚 | 东南亚、非洲、欧洲 |
卫星互联网
- 传统地球同步轨道(GEO):3.6 万公里高,延迟 600ms+,只适合广播电视
- 低轨星座(LEO):500–1200 公里高,延迟 30–50ms,可跑实时业务
- Starlink(SpaceX)已部署 7000+ 颗,OneWeb、Kuiper、中国"千帆星座"在跟进
海底光缆和低轨卫星不是替代关系,是互补:光缆容量碾压卫星几个数量级(成本/比特更低), 卫星的优势在于没基础设施的地方也能用(船舶、飞机、偏远山区、战场)。
第五层:数据中心
数据走到目的地,最终落在一座数据中心里。这是互联网最实体的部分。
一座现代数据中心长什么样
- 占地:几万到几十万平方米(足球场量级)
- 机柜数:几千到几十万个
- 服务器数:几十万到几百万台
- 耗电:几十兆瓦到上百兆瓦(一个小城市的用电量)
- 冷却:风冷为主,AI 数据中心已转向液冷甚至浸没式冷却
服务器与存储
机柜里塞满的"机器"主要分几类:
| 类型 | 用途 | 代表配置 |
|---|---|---|
| 通用服务器 | Web 服务、数据库、API | 2× 64 核 CPU + 1TB 内存 + NVMe SSD |
| GPU 服务器 | AI 训练 / 推理 | 8× H100 / B200 GPU + 1.5TB 内存 |
| 存储节点 | 大容量数据 | 36× 20TB HDD 或 24× 30TB SSD |
| 网络设备 | 内部交换 | Spine/Leaf 拓扑,单口 400G/800G |
数据中心之间也要互联
大公司通常运营多区域多机房:
- 同城多可用区(AZ):抗机房级故障
- 跨区域 / 跨大洲:抗地震、抗政策风险
- 各机房之间用专线骨干网(Google 的 B4、AWS 的 Backbone)连接,自带专属光缆
这就是为什么"云"听起来虚,但它实际上是 Google / AWS / Azure / 阿里 / 腾讯 / 华为 这几家公司在全球花了上千亿美元盖出来的物理设施。 你按月几十块钱付的云费用,对应的是这套实体网络的一小片分时使用权。
软件全景:让硬件变成"互联网"
硬件本身只是金属和玻璃。把它变成"互联网"的,是几层堆叠的软件。
协议栈(TCP/IP 模型)
应用层 HTTP/HTTPS、DNS、SMTP、SSH、QUIC
传输层 TCP(可靠)、UDP(快)
网络层 IPv4 / IPv6 + 路由协议(BGP / OSPF)
链路层 以太网、Wi-Fi、4G/5G
物理层 电信号、光信号、无线电波
详见序号 1 文章互联网进化史里 TCP/IP 的故事。
关键基础设施服务
| 服务 | 作用 | 没了它会怎样 |
|---|---|---|
| DNS | 域名→IP | 只能记 IP 上网 |
| CDN | 内容分发 | 海外网站打开慢 10–100 倍 |
| 证书机构(CA) | HTTPS 加密身份 | 浏览器一直报警告 |
| 时间同步(NTP) | 全网时钟一致 | TLS 失败、日志错乱 |
| BGP / 路由 | 全球路径选择 | 跨运营商互通中断 |
应用层组件
实际跑业务的软件,常见的组合:
浏览器/App → CDN/边缘节点 → 负载均衡 → Web 服务器
↓
应用服务器
↓
┌──────────┼──────────┐
↓ ↓ ↓
数据库 缓存(Redis) 消息队列
↓
对象存储 / 文件系统
每一层都有几十种产品在竞争:Nginx vs Caddy、MySQL vs PostgreSQL、Redis vs Memcached…… 但整体架构 20 年没怎么变——这也是互联网工程师能跨公司复用经验的原因。
一次访问的全链路(再来一遍,配上软件)
把硬件和软件拼起来,刚才那个 google.com 的故事可以重写一次:
1. 浏览器 → 解析 URL,找本地 DNS 缓存
2. 操作系统网络栈 → 向 DNS 服务器发查询(UDP 53)
3. Wi-Fi 网卡 → 路由器 → 光猫 → 信号沿光纤进运营商
4. 运营商 DNS(或公共 DNS 8.8.8.8)→ 返回 Google 服务器 IP
5. 浏览器与该 IP 建立 TCP 连接 → 三次握手(SYN/SYN-ACK/ACK)
6. TLS 握手 → 交换证书、协商加密密钥
7. HTTP/2 请求 → GET / HTTP/2
8. CDN 边缘节点(如果命中缓存) → 直接返回 HTML
9. 否则回源数据中心 → 走 Google 内部负载均衡
10. 应用服务器 → 查数据库 / 缓存,生成 HTML
11. HTML/CSS/JS 一路返程 → 反向走完上述链路
12. 浏览器渲染 → 解析 HTML、跑 JS、绘制像素到屏幕
0.3 秒内走完这 12 步,每一步都涉及多层硬件 + 多层软件协同。 没有任何一层是奢侈的——少一层链路就会断。
你下一次抱怨"网怎么这么慢"时,可以猜猜慢在哪一层: 延迟主要在第 1、5、6、9 步;带宽瓶颈通常在第 3 步(接入网)或第 11 步(CDN 边缘); 完全打不开通常是第 4 步(DNS 污染)或第 8 步(被 BGP 拦截)。
把这张图记进脑子里的好处
理解硬件 + 软件全景的实用价值:
- 看新闻不再迷糊——"红海光缆被切""日本机房断电""芯片禁运"分别对应哪一层、影响多大,你都能定位
- 职业选择更清楚——硬件工程师、网络工程师、运维、后端、前端、算法,对应的是哪一段链路一目了然
- 故障排查思路有了——网页打不开?从终端→Wi-Fi→DNS→TCP→应用,逐层排查比乱猜快几倍
- 对"自主可控"有判断——哪些层中国已经做得不错(5G 基站、光通信、整机),哪些层还卡脖子(高端芯片、操作系统内核),不会被各种叙事带偏
三个延伸的疑问
剩下三个问题,每一个都值得一篇文章单独讲:
- 光纤为什么这么重要? → 光纤对于互联网的作用
- 芯片如何决定上网速度? → 芯片对互联网的作用
- AI 时代基础设施会怎么变? → 第 7 篇 何为人工智能?对人类的利与弊
一句话总结
互联网 = 几百万公里玻璃丝 × 几亿台芯片 × 几亿行代码。 每一次"在线",都是这三样东西按 TCP/IP 协议协同工作的一瞬间。 它不在云端,它在你脚下的电缆、楼顶的天线、地球另一头的机房里—— 看清这一点之后,互联网就不再是"魔法",而是一台可以被理解的巨型机器。
延伸阅读
- 系列上一篇:Web3 是什么,能替代 Web2 吗?
- Tubes, Andrew Blum——把互联网当成"管子"实地走访的非虚构经典
- Computer Networks, Andrew Tanenbaum——网络专业本科生圣经
- submarinecablemap.com——全球海底光缆实时地图
- bgp.he.net——查任意 IP/AS 的全球路由