13. Roman to Integer
Roman numerals are represented by seven different symbols: I, V, X, L, C, D and M.
Symbol Value I 1 V 5 X 10 L 50 C 100 D 500 M 1000
For example, 2 is written as II in Roman numeral, just two ones added together. 12 is written as XII, which is simply X + II. The number 27 is written as XXVII, which is XX + V + II.
Roman numerals are usually written largest to smallest from left to right. However, the numeral for four is not IIII. Instead, the number four is written as IV. Because the one is before the five we subtract it making four. The same principle applies to the number nine, which is written as IX. There are six instances where subtraction is used:
Ican be placed beforeV(5) andX(10) to make 4 and 9.Xcan be placed beforeL(50) andC(100) to make 40 and 90.Ccan be placed beforeD(500) andM(1000) to make 400 and 900.
Given a roman numeral, convert it to an integer.
Example 1:
Input: s = "III" Output: 3 Explanation: III = 3.
Example 2:
Input: s = "LVIII" Output: 58 Explanation: L = 50, V= 5, III = 3.
Example 3:
Input: s = "MCMXCIV" Output: 1994 Explanation: M = 1000, CM = 900, XC = 90 and IV = 4.
Constraints:
1 <= s.length <= 15scontains only the characters('I', 'V', 'X', 'L', 'C', 'D', 'M').- It is guaranteed that
sis a valid roman numeral in the range[1, 3999].
class Solution {
public:
int romanToInt(string s) {
unordered_map <char, int> mp={
{'I',1},{'V',5},
{'X',10},{'L',50},
{'C',100},{'D',500},
{'M',1000}
};
int n = s.size();
int result = 0;
for(int i=0; i<n;i++){
if(i+1<n && mp[s[i]]<mp[s[i+1]]){
result -=mp[s[i]];
}else{
result +=mp[s[i]];
}
}
return result;
}
};
Điều kiện i + 1 < n trong đoạn code:
1. Ngăn chặn lỗi truy cập bộ nhớ (Out of Bounds)
Trong vòng lặp, bạn có đoạn kiểm tra mp[s[i+1]].
-
Nếu không có
i + 1 < n, khi vòng lặp chạy đến ký tự cuối cùng của chuỗi (vị tríi = n - 1), lệnhs[i+1]sẽ cố gắng truy cập vào vị trís[n]. -
Trong C++, vị trí
s[n]nằm ngoài phạm vi của chuỗi. Việc truy cập này có thể dẫn đến hành vi không xác định (Undefined Behavior) hoặc làm chương trình bị treo (Crash). -
Vì vậy,
i + 1 < nđảm bảo rằng luôn có một ký tự đứng sau ký tự hiện tại thì ta mới tiến hành so sánh.
2. Phục vụ logic đặc biệt của số La Mã
Số La Mã có quy tắc: Nếu một chữ số có giá trị nhỏ hơn đứng trước chữ số có giá trị lớn hơn, nó sẽ được trừ đi thay vì cộng vào.
Ví dụ với chuỗi "IV" (Số 4) (n = 2):
Bước 1: Khi i = 0 (Ký tự 'I')
-
Kiểm tra điều kiện
for:0 < 2(Đúng). -
Kiểm tra điều kiện
if:-
i + 1 < n=>0 + 1 < 2(Đúng). -
mp[s[0]] < mp[s[1]]=>mp['I'] < mp['V']=>1 < 5(Đúng).
-
-
Hành động:
result -= mp['I'](result = -1).
Bước 2: Khi i = 1 (Ký tự 'V')
-
Kiểm tra điều kiện
for:1 < 2(Đúng). -
Kiểm tra điều kiện
if:-
i + 1 < n=>1 + 1 < 2=>2 < 2(Sai!).
-
-
Hành động: Vì điều kiện
ifsai, chương trình nhảy vào nhánhelse:-
result += mp[s[1]]=>result += mp['V']=>result = -1 + 5 = 4.
-
Bước 3: Khi i = 2
-
Kiểm tra điều kiện
for:2 < 2(Sai). -
Hành động: Thoát vòng lặp và trả về
result = 4.
Trong thi đấu lập trình (Competitive Programming), có thể thay unordered_map bằng một mảng tĩnh hoặc câu lệnh switch-case để tăng tốc độ thực thi thêm một chút nữa (vì map vẫn mất chi phí hashing).
Ví dụ dùng switch-case:
int getValue(char c) {
switch (c) {
case 'I': return 1;
case 'V': return 5;
case 'X': return 10;
case 'L': return 50;
case 'C': return 100;
case 'D': return 500;
case 'M': return 1000;
default: return 0;
}
}
Hoặc:
int values[128];
values['I'] = 1;
values['V'] = 5;
values['X'] = 10;
values['L'] = 50;
values['C'] = 100;
values['D'] = 500;
values['M'] = 1000;
Tại sao dùng mảng tĩnh lại tốt hơn?
-
Tốc độ (Speed):
unordered_mapcần thời gian để tính toán vị trí của key (Hashing) và xử lý xung đột. Mảng tĩnh chỉ cần một phép cộng địa chỉ đơn giản (O(1) thuần túy). -
Bộ nhớ (Memory): Mảng 128 số nguyên chỉ tốn khoảng 128.4 = 512 bytes trên Stack, nhỏ hơn nhiều so với cấu trúc phức tạp bên trong một
unordered_maptrên Heap. -
An toàn: Sử dụng kích thước 128 dùng trực tiếp ký tự (
char) làm chỉ số (vì mã ASCII của các chữ cái nằm trong khoảng 0-127).