[Elasticsearch] Những Lưu ý khi config
production environment cho elasticsearch

Elasticsearch là công cụ dùng để lưu trữ, phân tích, search cho hệ thống theo dõi và phân tích log. Khi cài đặt elasticsearch nếu chúng ta chỉ cần setup trên môi trường development để research em yêu khoa học thì không cần phải quan tâm quá đến config và ràng buộc của elasticsearch, chỉ việc install và sử dụng.

Tuy nhiên, khi chúng ta đưa ra môi trường production để tiến hành sử dụng thì ta không thể cài đặt theo default được mà có 1 số lưu ý về việc cấu hình lại elasticsearch.

Run elasticsearch với quyền user thường (not root)

Khi chạy môi trường production, để đảm bảo an toàn và bảo mật cho toàn hệ thống, mình không nên run elasticsearch với user root, mình cần tạo 1 user thường dành riêng cho nó và phân quyền vào các nơi cấu hình, data, log, pid,…

Cấu hình nơi chứa data và log

Chúng ta cần quản lý nơi chứa data và log vì vậy cần cấu hình lại đường dẫn 2 nơi này để tiện quản lý sau này: path.datapath.logs

Cấu hình lại name của node và cluster

Trong trường hợp cần cấu hình chạy elasticsearch theo cluster thì ta cần khai báo node.name. Chúng ta cũng cần cấu hình cluster.name để các node được share cùng cluster name sẽ có thể join vào cluster. 

Cấu hình lại IP và port listen

Cấu hình IP mà elasticsearch sẽ dùng để listen nhận request, thường hệ thống production để tiết kiệm băng thông cũng như bảo mật, những service gọi nội bộ thường đi đường private và elasticsearch cũng vậy, để tăng tính bảo mật mình nên chỉ định IP mà elasticsearch sẽ listen, hạn chế listen all.

  • network.host: IP listen của dịch vụ.
  • transport.host: IP listen giao tiếp giữa các node trong cluster, thường thì giá trị này sẽ bằng với network.host, nếu có nhiều card mạng và cần phân biệt giữa listen dịch vụ và listen cluster thì có thể dùng

Quan tâm về tiêu chuẩn boostrap check

Nếu sử dụng transport.host hoặc network.host là loopback, localhost (default) thì elasticsearch sẽ không tiến hành bootstrap checks và sẽ run theo môi trường development.

Nếu set transport_host là 1 IP khác loopback thì cần phần tuân thủ bootstrap check:

  • Heap size check
  • File descriptor check
  • Memory lock check
  • Maximum number of threads check
  • Max file size check
  • Maximum size virtual memory check
  • Maximum map count check
  • Client JVM check
  • Use serial collector check
  • System call filter check
  • OnError and OnOutOfMemoryError checks
  • Early-access check
  • G1GC check
  • All permission check
  • Discovery configuration check

Các bạn tham khảo chi tiết thêm tại: Here

Kiểm tra và cấu hình lại Discovery

Khi config lại network.host thì default elasticsearch sẽ hiểu chạy theo cluster, nếu bạn muốn sử dụng cluster thì cần cấu hình các seed host nếu không khi bootstrap check sẽ báo lỗi không cho start dịch vụ

  • discovery.seed_hosts: Khai báo các host tham gia vào cluster
  • cluster.initial_master_nodes: Khai báo các node đủ điều kiện tham gia vote bầu master trong lần đầu start cluster

Ngoài ra nếu muốn chạy standard-alone mình nên cấu hình discovery.type: single-node. Khi đó mình không cần quan tâm tới 2 biến trên trong quá trình setup

Dưới đây là example một phần về config của elasticsearch

 

Tham khảo
https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

LEAVE A REPLY

Please enter your comment!
Please enter your name here