11 mẹo đơn giản để tăng hiệu suất Java
hồ hết các lập trình viên đều cho rằng việc optimize hiệu suất là một vấn đề phức tạp đòi hỏi nhiều kinh nghiệm và tri thức. cố nhiên, điều đó không phải sai, bởi optimize một áp dụng để đạt được hiệu suất tốt nhất không phải là một nhiệm vụ dễ dàng. Nhưng điều đó không có nghĩa là bạn không thể làm bất cứ điều gì nếu bạn không có những tri thức đó. Dưới đây là một số gợi ý và bài tập tốt nhất giúp bạn tạo ra một áp dụng hiệu quả.
Hầu hết các mẹo này đều dành cho Java. Nhưng cũng có một số language-independent (ngôn ngữ độc lập), mà bạn có thể áp dụng cho thảy các ứng dụng và tiếng nói lập trình. Chúng ta hãy nói về một số mẹo dành chung trước khi chúng ta đến các mẹo điều chỉnh hiệu suất của riêng Java.
1. Đừng Optimize khi nó không cấp thiết
Đó là một trong những mẹo điều chỉnh hiệu suất quan yếu nhất. Bạn nên làm theo các bước thông thường một cách tốt nhất và thử test các trường hợp sử dụng. Nhưng điều đó không có nghĩa là bạn cần thay thế bất kỳ thư viện chuẩn nào hoặc xây dựng các bước optimize (tối ưu hoá) phức tạp trước khi bạn xác định được đó là điều cấp thiết.
Trong Hầu hết các trường hợp, optimize sớm khiến tốn rất nhiều thời gian và làm cho code khó đọc và khó giữ nguyên. Và tệ hơn nữa, những hành động optimize này thường không mang lại bất kỳ ích nào vì bạn đang dành rất nhiều thời gian để optimize các phần không quan trọng của áp dụng của bạn.
Vậy làm thế nào để xác định được bạn cần optimize cái gì?
trước tiên, bạn cần phải xác định vận dụng của mình chạy nhanh như thế nào, tỉ dụ bằng cách xác định thời gian phản hồi tối đa cho vơ các lệnh call API hoặc số lượng bản record bạn muốn nhập trong một khung thời kì cố định. Sau khi bạn đã bước đó, bạn có thể tâm tính được những phần nào trong áp dụng của bạn quá chậm và cần phải được cải thiện. Và khi bạn đã xác định được, bạn nên xem tiếp mẹo thứ 2.
2. sử dụng Profiler để tìm điểm kém hiệu quả thật sự
Sau khi bạn làm theo mẹo trước tiên và xác định được các phần của ứng dụng cần cải tiến, hãy tự đặt câu hỏi phải bắt đầu từ đâu?
Bạn có thể tự giải quyết câu hỏi này theo hai cách:
Xem code của bạn và bắt đầu với những phần có vẻ đáng ngờ nhất hoặc điểm mà bạn cảm thấy nó có thể gây ra vấn đề.
Hoặc bạn sử dụng profiler và để nhận được thông tin chi tiết về trạng thái và hiệu suất của từng phần trong code.
Tôi nghĩ có lẽ không cần phải giải thích tại sao bạn nên chọn cách thứ hai.
Rõ ràng là phương pháp dựa vào profiler sẽ giúp bạn hiểu rõ hơn về hiệu suất của code và cho phép bạn tụ họp vào những phần quan trọng nhất. Và nếu bạn từng sử dụng một profiler, bạn sẽ nhớ một đôi tình huống khiến bạn ngạc nhiên bởi những phần code đã tạo ra các vấn đề về hiệu suất.
3. Tạo một bộ test hiệu suất cho ắt ứng dụng
Đây là một mẹo chung giúp bạn tránh được rất nhiều sự cố không mong muốn, thường xảy ra sau khi bạn đã khai triển bước cải tiến hiệu suất trong sản xuất. Bạn cần có một bộ test hiệu suất để thẩm tra vớ ứng dụng, chạy nó trước và sau khi bạn cải tiến hiệu suất để so sánh.
Những lần test bổ sung này sẽ giúp bạn xác định các chức năng và hiệu suất đã thay đổi thế nào và bảo đảm rằng bạn không tung ra bản cập nhật làm hại đến ứng dụng. Điều này đặc biệt quan trọng nếu bạn làm việc trên các component được dùng bởi một số phần khác nhau của vận dụng, như cơ sở dữ liệu hoặc caches.
4. Xử lý những nút thắt lớn nhất trước tiên
Và sau khi bạn đã tạo bộ test và phân tích vận dụng của bạn với một profiler, bạn sẽ có một danh sách các vấn đề bạn muốn giải quyết để cải thiện hiệu suất. Điều đó tốt, nhưng nó vẫn không giúp giải đáp được câu hỏi rằng nên bắt đầu từ đâu. Bạn có thể tập kết vào quick win (những điểm cần xử lý mau chóng) hoặc bắt đầu với một vấn đề quan trọng nhất.
Có thể bắt đầu với quick win vày bạn sẽ sớm có thể nhận được những kết quả đầu tiên. thỉnh thoảng, điều này có thể cấp thiết để thuyết phục các thành viên khác trong nhóm hoặc quản lý của bạn rằng việc phân tách hiệu suất là quan yếu.
Nhưng xét chung, tôi khuyên bạn nên bắt đầu từ đầu và đánh vào những vấn đề ảnh hưởng đến hiệu suất đáng kể nhất trước tiên. Điều đó sẽ giúp bạn cải tiến hiệu suất tốt nhất và bạn có thể không cần phải sửa nhiều mà chỉ cần sửa những vấn đề này để đạt được hiệu suất mong muốn.
4 mẹo vừa rồi là dành cho những vấn đề chung về hiệu suất. Chúng ta hãy cùng xem xét một số mẹo dành riêng cho Java nhé.
5. sử dụng StringBuilder để nối các String
Có rất nhiều phương thức để kết nối strings trong Java. Bạn có thể dùng những cách đơn giản như + hoặc +=, StringBuffer hoặc StringBuilder.
Vậy bạn thích cách tiếp cận nào nhất?
Câu đáp tùy thuộc vào code bạn kết nối String. Nếu là thêm nội dung với for-loop thì bạn nên dùng StringBuilder bởi nó dễ dùng và cho hiệu năng tốt hơn StringBuffer. (Lưu ý rằng StringBuffer thì an toàn và phù hợp cho nhiều tình huống).
Bạn chỉ cần instantiate một StringBuilder và call append method để add phần mới vào String. Sau khi đã add mọi thứ thì bạn có thể call toString() method để lấy lại các String được kết nối. Code snippet sau đây cho ta thấy trong mỗi lần iteration, loop convert i thành một String và add chúng với một khoảng trống vào StringBuilder sb. Do đó, Code viết vào log file như sau: “This is a test0 1 2 3 4 5 6 7 8 9”:
1
2
3
4
5
6
|
StringBuilder sb = new StringBuilder(“This is a test”);
for (int i=0; i<10; i++)
sb.append(i);
sb.append(” “);
log.info(sb.toString());
|
Bạn có thể thấy trong code snippet, ta cung cấp yếu tố trước nhất của String tới constructor method. Nó sẽ tạo ra StringBuilder mới chứa String được cung cấp kèm theo khoảng trống có thể thêm 16 kí tự nữa. Khi bạn add thêm kí tự vào StringBuilder, JVM sẽ lập tức tăng size của StringBuilder lên rất nhiều.
Còn nếu bạn đã biết có bao nhiêu kí tự trong String, bạn có thể giới hạn số lượng khoảng trống và nhờ đó tăng hiệu năng bởi nó không cần phải tự tăng sức chứa.
6. Dùng + để kết nối String trong một Statement
Khi bạn khai triển vận dụng đầu tiên trong Java, hẳn sẽ có ai đó nói với bạn rằng bạn không nên nối String bằng ‘+’. Và điều đó đúng nếu bạn đang nối String với application logic (các logic riêng cho một application cụ thể). Các String là không đổi thay và kết quả của mỗi String concatenation được lưu trong một String object mới. Điều đó đòi hỏi thêm memory và sẽ làm chậm áp dụng của bạn, đặc biệt nếu bạn đang nối nhiều String trong một loop (vòng lặp).
Trong những trường hợp này, bạn nên làm theo mẹo số 5 và sử dụng một StringBuilder.
Nhưng đó không phải là chọn lựa nếu bạn đang muốn phá vỡ một String thành nhiều dòng để cải thiện tính dễ đọc của code.
1
2
3
|
Query q = em.createQuery(“SELECT a.id, a.firstName, a.lastName ”
+ “FROM Author a ”
+ “WHERE a.id = :id”);
|
Trong những trường hợp này, bạn nên nối String của mình với một ‘+’ đơn giản. Trình biên dịch Java của bạn sẽ optimize điều này và thực hiện các concatenation tại thời gian compile. nên chi, trong runtime, code của bạn sẽ chỉ sử dụng 1 String.
7. sử dụng Primitives ở điểm có thể
Một cách chóng vánh và dễ dàng để tránh phí phát sinh và cải thiện hiệu suất của vận dụng là sử dụng các kiểu primitive thay vì các class wrapper của chúng. Vì vậy, tốt hơn hết là sử dụng một int thay vì một Integer, hoặc một double thay vì một Double. Điều đó cho phép JVM của bạn lưu trữ value trong stack thay vì trong heap để giảm mức độ tiêu thụ memory và xử lý tổng thể hiệu quả hơn.
8. cầm tránh BigInteger và BigDecimal
Như chúng ta đã nói về các loại dữ liệu, chúng ta cũng nên xem nhanh BigInteger và BigDecimal. Đặc biệt là vì tính xác thực của nó. Nhưng cái gì cũng có giá của nó.
BigInteger và BigDecimal yêu cầu memory nhiều hơn một long hoặc double đơn giản và làm chậm tuốt tuột các phép tính một cách đáng kể. Vì vậy, tốt hơn hãy nghĩ suy thật kỹ, nếu bạn cần tăng độ chuẩn xác hoặc nếu number của bạn vượt quá phạm vi của một long. Đây có thể là điều độc nhất bạn cần phải đổi thay để khắc phục các vấn đề về hiệu suất, đặc biệt là nếu bạn đang thực hành một mathematical algorithm (thuật toán về toán học).
9. soát ở Current Log trước tiên
Điều này là hiển nhiên, nhưng thật không may, bạn có thể thấy hiện có rất nhiều đoạn code bỏ qua nó. Trước khi tạo một thông tin debug, bạn nên xoành xoạch rà soát current log trước nhất. Nếu không, bạn có thể tạo một String mà log message sẽ bị bỏ qua.
Dưới đây là hai thí dụ về cách mà bạn KHÔNG nên làm.
1
2
3
4
|
// don’t do this
log.debug(“User [” + userName + “] called method X with [” + i + “]”);
// or this
log.debug(String.format(“User [%s] called method X with [%d]”, userName, i));
|
Trong cả hai trường hợp này, bạn sẽ thực hành tuốt các bước cần thiết để tạo ra log message mà không cần biết liệu logging framework của bạn có sử dụng log message hay không. Tốt hơn hết là rà soát mức độ current log trước nhất, trước khi bạn tạo ra các tin nhắn debug.
1
2
3
4
|
// do this
if (log.isDebugEnabled())
log.debug(“User [” + userName + “] called method X with [” + i + “]”);
|
10. sử dụng Apache thông thường StringUtils.Replace thay vì String.replace
Nói chung, method String.replace hoạt động tốt và hiệu quả khá cao, đặc biệt nếu bạn đang sử dụng Java 9. Nhưng nếu vận dụng của bạn đòi hỏi nhiều hoạt động replace và bạn chưa cập nhật phiên bản Java mới nhất, thì vẫn có các chọn lọc thay thế nhanh hơn và hiệu quả hơn.
Một ứng cử viên sáng giá là method StringUtils.replace của Apache Commons Lang. Như Lukas Eder mô tả trong một trong các bài blog gần đây của họ, nó vượt trội hơn method String.replace của Java 8.
Và nó chỉ đòi hỏi ít sự thay đổi. Bạn cần phải thêm một Maven dependency vào project Commons Lang của Apache vào application pom.xml của bạn và thay thế tất các lệnh call của method String.replace bằng method StringUtils.replace.
1
2
3
4
|
// replace this
test.replace(“test”, “simple test”);
// with this
StringUtils.replace(test, “test”, “simple test”);
|
11. Lưu trữ resource lớn, như kết nối Database
Caching (bộ nhớ đệm) là một giải pháp phổ thông để tránh việc lặp lại các đoạn code “nặng” hoặc bộc trực được sử dụng. Ý tưởng chung đơn giản là: Tái dùng các resources như vậy sẽ đỡ tốn kém hơn so với việc tạo ra một cái mới hơn.
Một tỉ dụ tiêu biểu là lưu trữ các kết nối cơ sở dữ liệu trong một pool. Việc tạo ra một kết nối mới đòi hỏi nhiều thời kì, bạn có thể tránh được điều đó nếu bạn sử dụng lại một kết nối hiện có.
Bạn cũng có thể tìm các tỉ dụ khác bằng chính tiếng nói Java. Method valueOf của class Integer, thí dụ, lưu các value giữa -128 và 127. Bạn có thể cho rằng việc tạo ra một Integer mới không phải là quá tốn kém, nhưng nó thường dùng cách lưu trữ các giá trị được dùng nhiều nhất để đạt hiệu suất tối đa.
Nhưng khi bạn nghĩ về cache, hãy nhớ rằng việc thực hành cache cũng tiêu tốn resource. Bạn cần phải dành thêm memory để lưu trữ các resource tái sử dụng và bạn có thể cần phải quản lý bộ nhớ cache của mình để giúp cho các resource có thể truy cập được hoặc để xóa các resource lỗi thời.
thành thử, trước khi bạn bắt đầu bộ nhớ cache bất kỳ resource nào, hãy bảo đảm rằng bạn dùng chúng thường đủ để vượt quá uổng của việc triển khai bộ nhớ cache của bạn.
Tổng kết
Như bạn đã thấy, thỉnh thoảng không cần quá nhiều công sức để cải thiện hiệu suất áp dụng của bạn. hồ hết các đề xuất trong bài này chỉ cần thêm một sự thay nhỏ là có thể ứng dụng chúng vào code của bạn.
- Nhưng như thông thường, những khuyến nghị quan trọng nhất vẫn là:
- Không optimize trước khi bạn biết nó là cần thiết
- sử dụng profiler để tìm ra nút thắt đích thực
- Xử lý nút thắt lớn nhất trước hết
Comments
Post a Comment