CDN是互联网中使用较频繁的一种技术。你也许常听人说:“我们的网站使用了CDN技术”,但可能他们对CDN的了解并不多,也许只局限于--用了以后网站访问速度会变快。
其实,CDN的原理非常简单。当浏览器请求一资源时,第一步是做DNS解析,DNS解析就像是从通讯录根据姓名找号码,浏览器发送域名,然后得到DNS服务器返回的IP地址。浏览器通过IP地址和服务器连接并获取资源(DNS服务器会有很多层的缓存,但超出本文范围)。
对于小站点或个人博客,一个域名对应一个IP地址,而大站点可能含多个IP地址。
当请求一个资源时(如网站),距离会影响连接速度,所以从国内访问国外的网站会比较慢。因此,一些大公司在世界各地配置服务器并同步数据,这就叫CDN,而那些离当地用户最近的服务器叫“边缘服务器(edge servers)”。
DNS解析
当浏览器通过CDN做域名解析请求时,针对单IP的网站会有一些不同。DNS服务器会找出最适合的服务器来处理请求,而且非常简单,DNS会找出离请求地点最近的边缘服务器。如下图所示,如果我从维吉尼亚州发送一个指向美国中部服务器的请求,就会得到位于东海岸的边缘服务器地址,如果我从加利福尼亚州发送请求,就会得到位于西海岸的边缘服务器地址。
也就是说处理请求的第一步:找出离请求位置最近的服务器。有些公司可能会用其他的方式优化CDN服务器,例如,如果最近的服务器满负荷运作,那么接下来的请求就会转到其他闲置的服务器。总之,CDN总会找出最适合的服务器来处理请求。
获取内容
边缘服务器是一种代理缓存,类似浏览器缓存。当请求到达边缘服务器,它会首先检查内容是否是最新的。缓存标识(key)就是整个Url地址(跟浏览器一样),如果内容已被缓存且没有过期,就直接返回缓存内容。
如果没有缓存或已过期,边缘服务器会向源服务器发送请求获取内容,并缓存起来。
雅虎创建了一个开源项目叫Apache Traffic Server,用来管理CDN直接的交互,如果想了解更多代理缓存的原理,推荐你读一下这个项目的文档。
示例
雅虎的CDN服务中,使用一个工具叫“组合处理器(combo handler)”,它会把多个文件的请求整合到一起,变成一个请求-响应操作。下面是例子:
域名yui.yahooapis.com是雅虎CDN服务的一部分,会把你的请求转给离你最近的边缘服务器,这个请求包含两个文件yui-base-min.js和array-extras-min.js,但只需一次响应便可完成。这些逻辑处理操作不在边缘服务器,只能在源服务器上。
静态指什么?什么情况适合使用CDN?
每当我描述类似上文的“组合处理器”之类的系统时,经常会看到别人困惑的表情。CDN有时候容易跟FTP资源混淆,因为它们都是上传静态资源供其他人获取。我希望我上文的描述能让大家搞清楚两者不一回事。边缘服务器是一个代理,源服务器告诉边缘服务器返回什么内容,源服务器可能是Java,Ruby,Node.js,.Net等,因此可以实现任何逻辑。边缘服务器什么也不做只是发生请求并返回内容。
既然CDN如此高效,为什么不把网站所有东西都用CDN来提高性能?CDN本质是缓存,如果保存的是动态页面,每次页面内容都会有所变化,那么每次请求都要边缘服务器和源服务器交互一次,那么这个缓存也就没有意义。
这也是为什么Javascript,CSS,images,Flash,音频,视频等文件特别适合使用CDN技术,因为这些文件是不变的,所有的用户获取的都一样,一旦通过CDN缓存,所有用户都将受益。
缓存过期
雅虎性能指南规定静态资源应该要有缓存过期标识保存在Http协议的header中,这么做有两个原因:其一,浏览器会缓存资源,其二,CDN也会将资源缓存一段时间。这同样意味着你不能使用重复的文件名,因为他们至少会被缓存在两个地方,用户可能会一直获取不到最新版本的文件。
有几种方式解决这个问题,YUI 库用包含不同版本库的目录来区分。通常也可以在文件名末尾加入标识符,如MD5的哈希值或者版本控制软件的修订号。任何一种方式都为了确保当用户的请求包含过期标识的时候,依然能获得最新版本的资源文件。
结语
CDN技术已经是当今互联网重要的一部分,随着时间的推移,它只会变得越来越重要。即便是现在,一些公司仍然努力尝试把更多的功能移到边缘服务器,以便能给用户更快速的体验。这里包含了一种技术叫Edge Side Includes (ESI),用来缓存页面的部分内容。
更好的理解CDN技术及工作原理是提升CDN性能的关键。
原文:http://www.nczonline.net/blog/2011/11/29/how-content-delivery-networks-cdns-work/
注:这是我第一次翻译英文文章,花了比想象中要多的时间,如果看完文章对你有帮助是我最大的欣慰,不足的地方欢迎批评指出。
从高耦合到低耦合到底有多远?
无论书还是博客, 耦合这个词已被无数人说烂,任何一位程序员都会告诉你设计软件要注意低耦合,可究竟什么是低耦合?每次去查这个问题,就会牵扯出各种术语和理论,让人头晕。最近看了一些英文资料,发现低耦合其实没那么复杂。
什么是耦合?怎样的代码叫高耦合?
“耦合”翻译自英文(coupling),英文描述是:"when a component has a dependency on something else". 这句话简单易懂--当一个组件对其他东西有依赖就叫耦合,为方便描述,先给段代码:
public class EmailService { public void SendMessage() { } } public class NotificationSystem { private EmailService svc; public NotificationSystem() { svc = new EmailService(); } public void InterestingEventHappend() { svc.SendMessage(); } }
代码的逻辑很简单:NotificationSystem通过内置的EmailService类发送邮件,即NotificationSystem的功能依赖EmailService类。我相信应有不少人对代码感觉亲切,我参与过的项目基本都这种风格,可惜这就是高耦合的设计。
高耦合翻译自“tightly coupled”,描述是这样的:"A class that knows a lot about the other classes it interacts with is said to be tightly coupled".翻译过来就是---它知道的太多了。^_^
最快的解耦方式
为了让它知道的不那么多,现在贴一份改良后的代码:
public interface IMessageService { void SendMessage(); } public class EmailService : IMessageService { public void SendMessage() { } } public class NotificationSystem { private IMessageService svc; public NotificationSystem() { svc = new EmailService(); } public void InterestingEventHappend() { svc.SendMessage(); } }
与之前比较,svc变量类型变成了接口IMessageService ,从而使NotificationSystem依赖IMessageService接口,而不是EmailService类。 但svc通过new 方式赋值,这让两个类藕断丝连,一旦EmailService变化,NotificationSystem也跟着变,违背了开闭原则。
通过控制反转彻底解耦
想彻底解耦,就要换一种方式对svc赋值,于是想到控制反转模式,控制反转翻译自“inversion of control”简称Ioc,一句话描述:“Moving the creation of dependencies outside of the class that consumes those dependencies”,简单翻译过来就是:在外面创建这个类。
现在我们先抽象一个接口用于“外部创建”。
public interface IMessageService { void SendMessage(); } public class EmailService : IMessageService { public void SendMessage() { } } public interface IServiceLocator { IMessageService GetMessageService(); } public class NotificationSystem { private IMessageService svc; public NotificationSystem(IServiceLocator locator) { svc = locator.GetMessageService(); } public void InterestingEventHappend() { svc.SendMessage(); } }
从代码看出,现在svc是通过IServiceLocator接口类创建,从而让原类之间解耦。IServiceLocator的实现类就像工厂模式,通过参数或配置文件等决定生成哪个类。然而这种做法让IServiceLocator和IMessageService 的实现类之间增加了耦合,每添加一个IMessageService 的实现类,就要修改IServiceLocator的代码,可能是switch或连续的if,这样看似不错的模式仍然违反开闭原则:
public class ServiceLocator:IServiceLocator { public IMessageService GetMessageService() { string type = "type1"; switch (type) { case "type1":return new EmailService1(); case "type2": return new EmailService2(); case "type3": return new EmailService3(); ………… } } }
用Ioc容器完成高耦合到低耦合的蜕变
完全蜕变,就要求助于依赖注入了,这个词和控制反转是好基友,一般都同时出现。实际开发中,我们往往使用IoC容器来实现依赖注入的需求。通过Ioc容器(以Autofac为例)改善代码如下:
public class NotificationSystem { private IMessageService svc; public NotificationSystem(IMessageService messageService) { svc = messageService; } public void InterestingEventHappend() { svc.SendMessage(); } }
可以看到NotificationSystem的构造函数直接传入IMessageService接口变量做参数。在全局类的代码如下:
var builder = new ContainerBuilder(); builder.RegisterType<EmailService>().As<IMessageService>();
通过依赖注入来实例化NotificationSystem类:
IMessageService messageService= container.Resolve<IMessageService>(); NotificationSystem system=new NotificationSystem(messageService);
借助Ioc的帮助,当IMessageService添加新的实现类时,也不用修改其他类的内部代码,在配置代码中,仅修改类名便可实现功能的切换。
结语
现在很多的开源代码都是这种模式,类内部依赖接口,通过Ioc容器灵活配置,熟悉了这种模式,有助于理解别人的设计意图,我也从中收益良多。但也有让我不爽的地方就是看别人的代码时,每次用F12跟踪源码,都会跳转到描述接口的代码文件中,想看具体实现总要害我找半天。
参考资料:<Professional Asp.Net MVC 3>