分布式Erlang/OTP（学习笔记）（一）

本文介绍: 当一台机器上的Erlang节点试图与某远程节点通信时，本地的EPMD就会联络远程机器上的EPMD（默认使用TCP/IP，端口为4369)，询问在远程机器上有没有叫相应名字的节点。请注意，Erlang默认的分布式模型基于这样一个假设，那就是集群中的所有节点都运行在一个受信网络内。当跨计算机通信的门槛不再那么陡峭，你终将获得翻越它的力量，并将之看作是习以为常的事情-─除非是出于某些特殊原因，否则你的进程完全可以运行在相互独立的多台机器上，这时你便可以开始设计在以前看来复杂得超乎想象的系统了。

假设你在机器A和机器B上各跑着一个Simple Cache应用的实例。要是在机器A的缓存上插人一个键/值对之后，从机器B上也可以访问，那可就好了。显然，要达到这个目的，机器A必须以某种方式将相关信息告知给机器B。传递该信息的方式有很多，有些方式简单，有些方式复杂。但无论采用哪种方式，都涉及分布式，因为你需要进行跨机器通信。
Erlang极大地简化了某些类型的分布式编程，用不了几行代码，你瞬间就可以建立多台机器间的网络通信。这一切都以Erlang的两个基本特性为基础:

复制式进程通信;
位置透明性。

在解决两段并发执行的代码段之间的通信问题时，最常用的模式就是让这两段代码共享某块内存,前提是它们都在同一台机器上运行。该通信模型如图所示。然而它有很多问题，其中之一是当你希望每段代码都运行在独立的机器上时，就必须换用一种完全不同的通信方式。代码中的很大一部分将被迫重写。

这类问题正是Erlang的缔造者们从一开始就要解决的问题。要想在通信透明化的同时构建出容错的系统，要想让一台机器不至于因为相邻机器的崩溃或机器间的网络故障而宕机，就必须抛弃共享。
相反，Erlang的进程间通信采用的是严格的异步消息传递（发送消息后无须等待网络上的确认)，接收方收到数据时实际上获取了数据的一份独立的副本;此后接收方将无法感知发送方对数据所做的任何操作，反之亦然。后续的任何通信都必须借助额外的消息才能进行。无论是运行在同一台机器上的进程还是运行在不同机器上并通过网络互联的进程,这种模型都非常凑效。

.在Erlang中没有共享，只有消息传递，因此分布式还是单机本质上没有什么区别。大部分代码完全不用关心进程最终在何处运行。

然而在进行网络通信时仍然有很多需要注意的问题。在使用本地通信时，只要接收方进程还“活着”消息就一定能送达，而且几乎没有传输延迟。然而一旦涉足网络，就不得不考虑路由过程中的消息延迟以及网络本身的故障了。发送方通常无法辨别接收方到底是崩溃了还是因自身的bug而未能给出应答。出于健壮性考虑，即便是采用本地通信，发送方也应该对这些故障有所准备。但在分布式系统中总会存在多种导致不确定性行为的因素。