获取URL | gopl-zh

1.5 获取URL

对于很多应用来说，访问互联网上的信息和访问本地文件系统一样重要。Go在net这个大package下提供了一系列的package来做这件事情，使用这些包可以更简单地用网络收发信息，还可以建立更底层的网络连接，编写服务器程序。在这些情景下，Go原生的并发特性(在第八章中会介绍)就显得尤其好用了。

为了最简单地展示基于HTTP获取信息的方式，下面给出一个示例程序fetch，这个程序将获取对应的url，并将其源文本打印出来；这个例子的灵感来源于curl工具(译注：unix下的一个工具)。当然了，curl提供的功能更为复杂丰富，这里我们只编写最简单的样例。之后我们还会在本书中经常用到这个例子。

gopl.io/ch1/fetch
// Fetch prints the content found at a URL.
package main
import (
    "fmt"
    "io/ioutil"
    "net/http"
    "os"
)

func main() {
    for _, url := range os.Args[1:] {
        resp, err := http.Get(url)
        if err != nil {
            fmt.Fprintf(os.Stderr, "fetch: %v\n", err)
            os.Exit(1)
        }
        b, err := ioutil.ReadAll(resp.Body)
        resp.Body.Close()
        if err != nil {
            fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)
            os.Exit(1)
        }
        fmt.Printf("%s", b)
    }
}

这个程序从两个package中导入了函数，net/http和io/ioutil，http.Get函数是创建HTTP请求的函数，如果获取过程没有出错，那么会在resp这个结构体中得到访问的请求结果。resp的Body字段包括一个可读的服务器响应流。这之后ioutil.ReadAll函数从response中读取到全部内容；其结果保存在变量b中。resp.Body.Close这一句会关闭resp的Body流，防止资源泄露，Printf函数会将结果b写出到标准输出流中。

$ go build gopl.io/ch1/fetch
$ ./fetch http://gopl.io
<html>
<head>
<title>The Go Programming Language</title>title>
...

HTTP请求如果失败了的话，会得到下面这样的结果：

$ ./fetch http://bad.gopl.io
fetch: Get http://bad.gopl.io: dial tcp: lookup bad.gopl.io: no such host

无论哪种失败原因，我们的程序都用了os.Exit函数来终止进程，并且返回一个status错误码，其值为1。

Exercise1.7: 函数调用io.Copy(dst, src)会从src中读取内容，并将读到的结果写入到dst中，使用这个函数替代掉例子中的ioutil.ReadAll来拷贝响应结构体到os.Stdout，避免申请一个缓冲区(例子中的b)来存储。记得处理io.Copy返回结果中的错误。
Exercise 1.8: 修改fetch这个范例，如果输入的url参数没有http://前缀的话，为这个url加上该前缀。你可能会用到strings.HasPrefix这个函数。
Exercise 1.9: 修改fetch打印出HTTP协议的状态码，可以从resp.Status变量得到该状态码。