Lập Trình Mạng Với Thư Viện Winsock trên VC++ (Part 2)

III. ĐỊA CHỈ MẠNG

Thread trước mình đã giới thiệu về SOCKET tuy nhiên mình chỉ nói khởi tạo, còn việc để gửi hay nhận gói tin cần phải thêm thông tin về địa chỉ IP cho nó nữa.

Ở Thread này mình sẽ tạm gác lại về SOCKET và C/C++ để đi sâu vào kiến thức cơ bản mạng cụ thể là địa chỉ IP. Bởi vì bạn muốn lập trình được chương trình truyền dữ liệu trên protocol TCP/IP mà không biết về IP thì hơi vô lý. Do đó cái thread này có phần đi ngoài lề về lập trình 1 xíu.

1. Địa chỉ IP
Một HOST muốn giao dịch trên mạng sử dụng giao thức TCP/IP thì cần phải có 1 địa IP duy nhất để xác địch chính nó (như địa chỉ nhà bạn) trên môi trường mạng.

Hiện nay có 2 loại địa chỉ IP. Đó là IPv4 (4 bytes) và IPv6. Tuy nhiên IPv6 vẫn chưa thể thay thế cho IPv4 được bởi vì số thiết bị dùng IPv4 quá nhiều.

Cài đặt địa chỉ IP ở đâu ?

Hiện này IPv4 sử dụng rất nhiều và nó sẽ dùng 4bytes (32bit) để biểu diễn 1 địa chỉ
Cấu trúc địa chỉ bao gồm 2 phần là: Network_id và Host_id

2. Các lớp địa chỉ IP
Địa chỉ IP có thể phân tới 5 lớp (dựa trên Network_id) nhưng thực tế thì chỉ có 3 lớp A,B,C được sử dụng.

a. Lớp A
– Số byte làm Network_id: 1 byte (địa chỉ đầu tiên từ 0 – 127)
– Số byte là Host_id: 3 bytes còn lại (trong 1 Network không được trùng)
– Subnet Mask: 255.0.0.0
– Địa chỉ BroadCast (đại diện cho tất cả các máy trong đường mạng -> Khi gởi tới địa chỉ này thì mọi host trong mạng sẽ nhận). x x x.255.255.255.
– Địa chỉ Network (đai diện bất kỳ một máy trong mạng – thường dùng để kiểm soát, định tuyến,…) x x x.0.0.0
Ví dụ: 10.1.1.1

* Trong lớp A có đường mạng 127.0.0.0 là đường mạng không sử dụng, nó được sử dụng để kiểm tra giao thúc TCP/IP. Ví dụ bạn ping 127.0.0.1 thì luôn nhận reply vì đây là địa chỉ máy tính của bạn cho dù IP của bạn ở lớp nào đi chăng nữa địa chỉ này chỉ sử dụng tại máy tính của bạn mà thôi.

b. Lớp B
– Số byte làm Network_id: 2 byte (địa chỉ đầu tiên từ 128 – 191)
– Số byte là Host_id: 2 bytes còn lại (trong 1 Network không được trùng)
– Subnet Mask: 255.255.0.0
– Địa chỉ BroadCast (đại diện cho tất cả các máy trong đường mạng -> Khi gởi tới địa chỉ này thì mọi host trong mạng sẽ nhận). x x x.x x x.255.255.
– Địa chỉ Network (đai diện bất kỳ một máy trong mạng – thường dùng để kiểm soát, định tuyến,…) x x x.x x x.0.0
Ví dụ: 172.11.22.3

c. Lớp C
– Số byte làm Network_id: 3 byte (địa chỉ đầu tiên từ 192 – 223)
– Số byte là Host_id: 1 bytes còn lại (trong 1 Network không được trùng)
– Subnet Mask: 255.255.255.0
– Địa chỉ BroadCast (đại diện cho tất cả các máy trong đường mạng -> Khi gởi tới địa chỉ này thì mọi host trong mạng sẽ nhận). x x x.x x x.x x x.255.
– Địa chỉ Network (đai diện bất kỳ một máy trong mạng – thường dùng để kiểm soát, định tuyến,…) x x x.x x x.x x x.0
Ví dụ: 192.168.23.3

Vấn đề về Subnet Mask bạn cứ chấp nhận như vậy vì mình cũng không muốn đi sâu vào chuyên môn của mạng, đơn giản là vì đây là BOX C/C++.

d. Network_id và Host_id có ý nghĩa gì?
Ví dụ địa chỉ IP lớp C:
IP: 192.168.10.4
Thì sẽ có:
Mask: 255.2255.255.0
BroadCast: 192.168.10.255
Network: 192.168.10.0

Ví dụ mình sẽ có thêm 2 HOST với 2 địa chỉ IP cùng lớp C nữa là: 192.168.10.3 và 192.168.11.2
Như vậy:
– Nếu mình ở tại máy tính có địa chỉ 192.168.10.4 (start -> run -> “cmd”)
+ ping 192.168.10.3 thì mình sẽ nhận được reply tức là 2 địa chỉ này “thông mạng” vì cùng Network là: 192.168.10.0 
+ ping 192.168.11.2 thì kết quả sẽ là “request time out”. (Không liên lạc được) bởi vì 2 host này ở 2 mạng khác nhau (192.168.10.0 và 192.168.11.0).

Như vậy:
– Network_id sẽ quy định host trong đó thuộc “đường mạng” nào. Và các host chỉ thấy nhau khi cùng “đường mạng”
– Host_id: dùng để phân biệt host với tất cả các host khác trong mạng

Tiếp tục… Nếu để 2 đường mạng như trên 192.168.10.0 và 192.168.11.0 có thể “liên lạc” với nhau thì sao? Người ta cần định tuyến mạng với thiết bị mạng có tên là Router (Modem ADSL cũng là 1 router) hoặc một máy chủ Sever có dịch vụ RAS (routing), hoặc một Proxy….

=> Router là một thiết bị có 2 card mạng và sẽ có ít nhất 2 địa chỉ IP. Trong hình trên thì Card mạng thứ 2 của hai router phải thiết lập sao cho có cùng đường mạng để “liên lạc với nhau”. Ví dụ như là 192.168.12.0. Như vậy LAN 1 sẽ liên lạc được với LAN 2 thông qua 2 router trên hình.

3. Tại sao lại phân loại địa chỉ IP
– Là do nhu cầu của từng môi trường mạng.

Ví dụ ở lớp A: 
– Network_id sẽ là 1 bytes (8 bits)
-> Nó sẽ có 2^7 = 127 (đường mạng)
+ Tại sao là 8 bit nhưng lại là 2^7 ? -> Là vì số bit từ làm Subnet là 0 -> 7 (biểu diễn tới 2^7)
– Host_id là (24 bits):
-> 2^24 – 2 = 16.777.214 (Hosts) (trừ 2 địa chỉ Broadcast và Subnet)
=> Ở lớp A số đường mạng ít nhưng số host trên đường mạng nhiều -> thích hợp với các công ty lớn

Ví dụ ở lớp B: 
– Network_id sẽ là 2 bytes (16 bits)
-> Nó sẽ có 2^15 = 16.384 (đường mạng)
– Host_id là (16 bits):
-> 2^16 – 2 = 65.534 (hosts)
=> Số đường mạng lớp B và số host vừa nhau

Ví dụ ở lớp C: 
– Network_id sẽ là 3 bytes (24 bits)
-> Nó sẽ có 2^23 = 2.097152 (đường mạng)
– Host_id là (8 bits):
-> 2^8 – 2 = 254 (Hosts)
=> Số đường mạng lớp C rất nhiều những host mỗi đường mạng lại rất ít. Và có lẽ lớp C là lớp được sử dụng nhiều trong mạng LAN bởi lẽ với con số PC dưới 100 trên phòng máy thì lớp C là lựa chọn hay nhất.

Hy vọng tới đây các bạn sẽ hình dung 1 chút ít gì đó về địa chỉ IP.

4. IP LAN và IP WAN

a. IP LAN (PRIVATE IP): 
Trong dãy các IP đó thì người ta trích mỗi lớp một khoảng làm IP LAN và nó chỉ có tác dụng giao dịch trong mạng LAN. Chúng ta có thể đặt IP cho card mạng với những khoảng dưới đây.
Lớp A: 10.0.0.0 đến 10.255.255.255 (số lượng đường mạng 1)
Lớp B: 172.16.0.0 đến 172.31.255.255 (số lượng đường mạng 16)
Lớp C: 192.168.0.0 đến 192.168.255.255 (số lượng đường mạng 256)

b. IP WAN (PUBLIC IP): 
Là các IP còn lại không thuộc IP LAN. Đây là IP mà cả thế giới thấy được, và muốn có bạn phải mua hoặc được ISP cung cấp (về bản chất thì ISP cũng mua các khoảng IP này và cung cấp các dịch vụ Internet như ADSL, mỗi IP là 1 thuê bao ADSL).

Ví dụ máy tính của bạn có IP là: 172.16.10.2
– Tại một nơi nào đó trên thế giới bạn truy cập tới địa chỉ này -> Không thể được vì nó là IP LAN, một IP chỉ có giá trị trong mạng LAN )
– Chúng ta muốn thế giới thấy được chúng ta thì chúng ta phải có IP WAN. Ở gia đình mạng ADSL của có thể có rất nhiều máy tính bên trong mang IP LAN. Nhưng có 1 thiết bị có IP WAN là ADSL Router và mọi người trên thế giới thấy được nó, tuy nhiên đây là địa chỉ động và bị thay đổi liên tục… do đó việc truy cập cũng rất khó.
Bạn có thể nghiên cứu thêm vấn đề này bằng cách vào google và gõ từ khóa “NAT” (“Network Address Translation”)

5. Địa chỉ IP trong thực tế

a. Một số địa chỉ IP cần thiết:

Hãy xem mô hình mạng của mình.
Bạn vào start->run->”cmd” gõ lệnh “ipconfig /all”

Code:
  IP Address. . . . . . . . . . . . : 192.168.1.254
  Subnet Mask . . . . . . . . . . . : 255.255.255.0
  Default Gateway . . . . . . . . . : 192.168.1.1
  DNS Servers . . . . . . . . . . . : 203.113.131.1
                                      203.113.131.2

– Default Gateway: Cổng ra của gói tin mà ta muốn gửi đi nếu địa chỉ đến của gói tin đó khác đường mạng. Và đây thường là địa chỉ của những thiết bị làm nhiệm vụ định tuyến (Routing) như ADSL Modem

Địa chỉ IP 192.168.1.1 (IP LAN) chính là địa chỉ của cái ADSL Moderm. Rõ ràng nó phải cùng đường mạng với máy tính của mình (đường mạng: 192.168.1.0)

– DNS Servers: Là dịch vụ phân giải tên miền. Khi ta truy cập internet thì nó sẽ chuyển đổi giữa tên miền -> IP:

Ví dụ như mình gõ: http://www.google.com –> DNS SERVER->http://72.14.207.99

DNS SERVER như là một “cơ sở dữ liệu khổng lồ” mà mỗi record sẽ là một tên miền và 1 IP. Do được phân cấp theo dạng cây “vn -> com -> google” nên khả năng tìm kiếm của DNS rất nhanh.

DNS của mạng FTP là 203.113.131.1 (IP WAN) và 1 cái dự phòng là 203.113.131.2. Dịch vụ thì VNN (203.162.4.190, 203.162.4.191, 203.162.0.181,… ) và của Viettel thì khác, cũng có thể DNS là GateWay nhưng thực chất trong ADSL Router nhà cung cấp ISP đã cài đặt DNS truy vấn tới các địa chỉ trên rồi.

b. Truy cập WEB trên Internet:

– Để minh họa hơn về IP,mình sẽ lấy 1 ví dụ về truy cập WEB trên Internet.

– Bắt đầu khi ta gõ: http://www.google.com từ PC có địa chỉ 192.168.1.254

– Host 192.168.1.254 sẽ nhờ DNS SERVER (203.113.131.1) phân giải dùm google.com có địa chỉ IP là bao nhiêu??? (72.14.207.99)

– Và lúc này có kết quả tương đương: http://72.14.207.99

– Sau đó host sẽ truy cập tới 72.14.207.99 nhưng thực sự là nó nhờ Gateway (ADSL Router 192.168.1.1) vì khác đường mạng.

– ADSL Router hiểu như là 1 PC có 2 card mạng
+ 1 cái mang địa chỉ IP LAN để giao dịch bên trong đường mạng 192.168.1.0.
+ 1 cái mang địa chỉ IP WAN thay đổi mỗi lần khởi động do ISP cung cấp (ví dụ như VNN hay FTP, Viettel…) để giao dịch bên ngoài Internet.
+ Và nhiệm vụ của ADSL Router là sẽ định tuyến và xác định đường đi từ Việt Nam qua Singapo (Trung quốc) -> … -> Mỹ để truy cập tới địa chỉ 72.14.207.99. Và lấy nội dung trang WEB về.

– Cuối cùng nó sẽ trả lại cho host mang địa chỉ 192.168.1.254 và trang WEB của google sẽ hiện ra trên web browser…

6. Biểu diễn địa chỉ IP trong Winsock
Quay lại về vấn đề WINSOCK
Tại sao IP quan trọng trong lập trình mạng như vậy, bởi vì IP rất quan trọng trong mô hình TCP/IP.
– 1 Server phải có 1 IP để lắng nghe kết nối trên địa chỉ IP của mình.
– 1 Client muốn kết nối với Server thì phải có IP của Server…

Trong Winsock người ta sử dụng cấu trúc sockaddr_in để biểu diễn địa chỉ IP.

struct sockaddr_in{
short           sin_family;
u_short         sin_port;
struct in_addr  sin_addr;
char            sin_zero[8];
};

Trong đó:
– sin_family: AF_INET
– sin_port: 
Là port (cổng logic) để lắng nghe kết nối.
-> 1 ứng dụng Server hay Client rất cần 1 port để liên lạc trên mạng. Bởi vì card mạng sẽ thông qua số hiệu port này để nhận biết được gói tin đang nhận (hay gửi đi) của ứng dụng nào?

– Các port dưới 1024 là những port dành riêng cho các dịch vụ như:
Một số port như: 80 (Web), 20,21 (FTP), Mail (25 SMTP, 993 POP3), 53 (DNS), 22 (SSH), 23 (Telnet)…

Ví dụ như ta gõ http://www.google.com
– http là giao thức WEB => Port 80.
– www.google.com => IP: 72.14.207.99
Như vậy tại Client sẽ khởi tạo 1 port (lớn hơn 1024) kết nối tới địa chỉ 72.14.207.99 qua port 80.

Dựa vào số port người quản trị có thể kiểm soát được mạng ví dụ như chỉ có lướt WEB (mở port 80, 53) nhưng chặn hết các port khác => Bạn không thể chat và gameonline mặc dù có Internet.

Với số nguyên u_short (16bit) có nghĩa có thể chọn tới 2^16 = 65535 port sử dụng giao dịch trên mạng. à ứng dụng của chúng ta phải chọn port lớn hơn 1024 nếu hông muốn viết 1 Sever như WEB hay FTP,…

– sin_addr: là một struct để xác định địa chỉ IP (có thể là IP của Server hoặc IP của chính mình,…)
– Nếu sin_addr.s_addr = INADDR_ANY; Thì IP sẽ chính là IP của mình. Các Server thường dùng để chọn địa chỉ IP của mình và lắng nghe kết nối..
– Nếu sin_addr.s_addr = inet_addr(“x x x.x x x.x x x.xx”); Thì IP sẽ là IP chỉ định theo chuỗi. Client phải chỉ định được IP của Server mới kế nối được.

– sin_zero Để dành 8 byte (không sử dụng).

Ví dụ:

sockaddr_in ip;
ip.sin_family = AF_INET;
ip.sin_port = htons(99999);
ip.sin_addr.s_addr = inet_addr(“10.0.0.2″);

IV. ỨNG DỤNG CLIENT – SERVER

1. Ứng dụng Client – Server là gì? 
Trước tới giờ, các bạn lập trình với mục đích là tạo ra được một ứng dụng. Nhưng ứng dụng đó chỉ hoạt động độc lập 1 mình riêng lẽ.

Mục tiêu lập trình mạng sẽ đưa ra những ứng dụng dạng Client – Server. Tức là sẽ có 2 loại ứng dụng chính đó là Client và Server.

Quy trình hoạt động của ứng dụng Server – Client như sau:
– Server có nhiệm vụ của là lắng nghe, chờ đợi kết nối từ Client trên địa chỉ IP của mình với PORT được quy định sẵn. Khi client gởi dữ liệu tới Server thì nó phải giải quyết một công việc là nhận dữ liệu đó -> xử lý -> trả kết quả lại cho Client.
– Client là ứng dụng được phục vụ, nó chỉ gởi truy vấn và chờ đợi kết quả từ Server.

Trong mô hình TCP/IP có 2 giao thức là TCP và UDP và 2 giao thức này sẽ quyết định cách thức hoạt động của Client – Server như thế nào?

a. Hoạt động của Client – Server trong giao thức TCP (SOCK_STREAM) 

b. Hoạt động của Client – Server trong giao thức UDP (SOCK_DGRAM) 

2. Một số hàm liên quan tới gởi và nhận dữ liệu

a. BIND

int bind(
SOCKET                     s,
const struct sockaddr FAR* name,
int                        namelen
);

Tác dụng dụng của BIND là sẽ giúp cho SOCKET của SERVER biết rằng nó sẽ chờ đợi kết nối và nhận dữ liệu trên IP nào và PORT bao nhiêu?
PORT nên chọn ở đây nên ở trong khoảng nào:
– 0 -1023: Là những PORT đã được sử dụng bởi các dịch vụ như WEB, FTP, …
– 1024-49151: Là PORT dành cho SERVER lắng nghe. SERVER nên chọn trong khoảng này.
– 49152-65535: Là PORT khởi tạo ngẫu nhiên dành cho CLIENT kết nối tới Server.

Hàm Bind gồm có 3 thông số:
– SOCKET s: Socket được thiết lập
– sockaddr name: Cấu trúc ADDR bao gồm địa chỉ IP và PORT
– int namelen: Kích thước của cấu trúc sockaddr

Ví dụ:

#define MYPORT 12345// Chọn giao thức TCP
SOCKET sockfd = socket(AF_INET, SOCK_STREAM, 0);// Thiết lập IP
sockaddr_in my_addr;
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(MYPORT);
my_addr.sin_addr.s_addr = INADDR_ANY;
// Đưa IP và PORT vào SOCKET
bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

b. LISTEN

int listen(
SOCKET s,
int    backlog
);

Kể từ khi gọi hàm này thì SERVER sẽ bắt đầu lắng nghe kết nối của mình.

Hàm LISTEN gồm có 2 thông số:
– SOCKET s: Socket đã được thiết lập IP và PORT.
– int backlog: Số kết nối cho phép chờ trong hàng đợi khi Server chưa chấp nhận kết nối. (vì đôi lúc có thể có tới 2 hay 3 client kết nối tới cùng 1 lúc). Giá trị tốt nhất là khoảng từ 5 – 10.

c. CONNECT

int connect(
SOCKET s,
struct sockaddr *serv_addr,
int addrlen );

Hàm được gọi từ CLIENT nếu nó muốn kết nối tới SERVER
– SOCKET s: Socket đã được khởi tạo.
– sockaddr *serv_addr: IP và PORT của Server.
– int addrlen: Sizeof của cấu trúc sockaddr.

d. ACCEPT

SOCKET accept(
SOCKET  s,
struct sockaddr FAR*  addr,
int FAR*  addrlen
);

Khi Client kết nối tới Server. Nó phải chờ Server chấp nhận kết nối (nếu ở giao thức TCP) bằng hàm accept trên.

Hàm ACCEPT gồm có 2 thông số:
– SOCKET s: Socket lắng nghe của SERVER.
– sockaddr addr: Là cấu trúc sockaddr lưu địa chỉ IP và PORT của CLIENT kết nối tới SERVER.
– int addrlen: Kích thước cấu trúc địa chỉ IP này.

Hàm ACCPET trả về 1 SOCKET mới
Socket mới được tạo này đại diện cho 1 Connection (kết nối) mới giữa Server và Client. Sau khi đã truyền dữ liệu thì ta phải đóng SOCKET này lại bằng hàm close như closesocket(connect);

e. REVC/SEND

* Nhận dữ liệu trên giao thức TCP

int recv(
SOCKET s,
char FAR* buf,
int len,
int flags
);

* Gửi dữ liệu giao thức TCP

int send(
SOCKET s,
const char FAR * buf,
int len,
int flags
);

– SOCKET s: Là SOCKET được tạo ra khi Server chấp nhận kết nối từ CLIENT
– char FAR* buf: Là dữ liệu (dạng BYTE – char) nhận hay gửi.
– int len: Kích thước của dữ liệu.
– int flags: Một số cờ hiệu đi kèm (thông thường là 0).

f. REVCFROM/SENDTO

Được sử dụng trên giao thức UDP

int recvfrom(
SOCKET s,
char FAR* buf,
int len,
int flags,
struct sockaddr *from,
int *fromlen);

Các thông số:
– SOCKET s: Là SOCKET được tạo ra ban đầu.
– char FAR* buf: Là dữ liệu (dạng BYTE – char) nhận
– int len: Kích thước của dữ liệu nhận.
– int flags: Một số cờ hiệu đi kèm (thông thường là 0).
– sockaddr *from: IP và PORT từ bên gửi.
– int *fromlen: Sizeof cấu trúc addr.

int sendto(
SOCKET s,const char FAR *buf,
int len,int flags,
const struct sockaddr* to,
int tolen
);

– SOCKET s: Là SOCKET được tạo ra ban đầu.
– char FAR* buf: Là dữ liệu (dạng BYTE – char) gửi
– int len: Kích thước của dữ liệu gửi.
– int flags: Một số cờ hiệu đi kèm (thông thường là 0).
– sockaddr *to: IP và PORT tới bên nhận.
– int tolen: Sizeof cấu trúc addr.

g. CLOSE/SHUTDOWN

int shutdown(
SOCKET s,
int how
);
 int closesocket (SOCKET s);

Hủy SOCKET sau một kết nối hoặc kết thúc chương trình.
Tham số how của shutdown:
– SD_RECEIVE: Đóng SOCKET, không cho phép NHẬN nhưng cho phép GỬI.
– SD_SEND: Đóng SOCKET, không cho phép GỬI nhưng cho phép NHẬN.
– SD_BOTH: Không cho GỬI và NHẬN (giống gọi hàm closesocket).

Tại sao có chuyện đóng nhưng cho phép gửi và nhận, là do Winsock hỗ trợ rất nhiều giao thức như ATM, IPX,… do đó nó có những cái phức tạp, mình cũng không hiểu rõ bởi vì khả năng dịch vẫn hạn chế. Vì vậy có lẽ vẫn nên sử dụng SD_BOTH hoặc closesocket).

About Argron Nguyen's Blog

Vietnamese. Photographer. Writer. Illustrator. IT-er. All to some extent.

Posted on 13.03.2012, in Network Programming. Bookmark the permalink. %(count) bình luận.

  1. :> Blog thật hoành tráng

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s

%d bloggers like this: