Nhập chuỗi ký tự C++

Ký tự '\0' được tự động thêm vào bởi trình dịch để đánh dấu điểm kết thúc của chuỗi. Vậy nên, ta nên khai báo một biến chuỗi với kích thước lớn hơn kích thước tối đa của chuỗi một đơn vị để có vị trí lưu trữ ký tự kết thúc.

Khai báo chuỗi

Bản chất của việc khai báo một chuỗi chính là khai báo một mảng ký tự một chiều. Vì thế, ta có cú pháp khai báo chuỗi như sau:

char Tên_chuỗi[Kích_thước];

, trong đó, Tên_chuỗi do ta tự đặt tuân theo quy tắc đặt tên chung của ngôn ngữ C, Kích_thước là một số nguyên dương thể hiện số lượng ký tự tối đa của chuỗi.

Ví dụ, nếu bạn muốn khai báo một chuỗi có tên là str và có kích thước tối đa là 25 ký tự, ta có thể làm như sau: char str[26];

Dưới đây là một số ví dụ nữa về cách khai báo chuỗi:

char str1[4] = {'L', '0', 'P'}; //khai báo và gán từng ký tự cho chuỗi str1

char str2[4] = "Lop"; /* ngôn ngữ C sẽ tự động ghi ký tự kết thúc là NULL, tức là ' \0' */

char str3[] = "Study"; //không cần khai báo kích thước

Xin lưu ý là bạn không thể làm như sau:

char S[5];

S="abc"; //sai, chương trình sẽ hiểu là gán mảng cho mảng vì chuỗi là mảng ký tự một chiều

Nhập liệu cho chuỗi

Sử dụng hàm gets() (thuộc thư viện ) được coi là cách thức đơn giản và phổ biến nhất để ta tiến hành nhập liệu cho chuỗi. Cú pháp sử dụng hàm này như sau: gets(Tên_chuỗi);

Ví dụ sau sẽ nhập liệu cho chuỗi a có kích thước tối đa là 30:

char a[30];
printf("\nMoi ban nhap mot chuoi: ");
gets(a);

Ngoài ra, ta cũng có thể sử dụng hàm scanf() để nhập liệu cho chuỗi, khi đó ta sử dụng định dạng của chuỗi là %s. Lưu ý là scanf() không cho phép nhập chuỗi có dấu cách và do đó, khuyến nghị là không nên dùng hàm này để nhập chuỗi.

Chú ý: nếu trước khi nhập chuỗi ta đã nhập một số thì trong bộ đệm nhập liệu còn tồn tại ký tự Enter, khi đó ký tự này sẽ được đưa cho chuỗi dẫn đến không nhập liệu được. Để khắc phục điều này ta sử dụng lệnh sau đặt trước hàm gets(): fflush(stdin); . Ví dụ:

#include <stdio.h>

main() {

  char a[30];
  int n;

  printf("\nMoi nhap mot so: ");
  scanf("%d",&n);

  printf("\nMoi ban nhap mot chuoi: ");
  fflush(stdin); //<= ta cn s dng lnh này
  // đ đm bo b đm nhp liu không cha
  // gì trước khi nhp chui hoc ký t  gets(a);

  return 0;
}

Ví dụ về xử lý chuỗi

Viết chương trình chuyển đổi một chuỗi ký tự thường thành HOA. Dưới đây trình bày hai cách xử lý yêu cầu này.

* Cách 1: Dùng hàm toupper(ch) (thuộc thư viện ) để chuyển ký tự thường thành ký tự HOA. Chương trình được viết như sau:

#include<stdio.h>
#include<ctype.h>
#define n 20

main() {
  char s[n];
  int i;

  printf("\nMoi nhap 1 chuoi bat ky: ");
  for ( i = 0 ; i < n ; i ++ )
    s[i]=toupper(getchar()); //nhp ký t và đi thành hoa ri lưu vào mng kết xut chui s

  printf("\nChuoi sau khi duoc chuyen doi thanh chuoi in hoa:\n");
  for(i=0; i<n; i++)
    putchar(s[i]); //in tng ký t ra màn hình

  return 0;
}

* Cách 2: Dùng hàm strupr(str) thuộc thư viện  để chuyển chuỗi str thành chuỗi in HOA. Chương trình được viết như sau:

Ở bài học trước, bạn đã nắm được TOÁN TỬ QUAN HỆ, LOGIC, BITWISE,MISC VÀ ĐỘ ƯU TIÊN TOÁN TỬ TRONG C++ (Operators).

Hôm nay, mình sẽ hướng dẫn về phần Cơ bản về chuỗi ký tự trong C++ (String).


Nội dung

Để đọc hiểu bài này tốt nhất các bạn nên có kiến thức cơ bản về các phần:

Trong bài ta sẽ cùng tìm hiểu các vấn đề:

  • Tổng quan về chuỗi ký tự (std::string)
  • Khai báo, khởi tạo và gán giá trị một chuỗi ký tự
  • Xuất một chuỗi ký tự (string output)
  • Nhập một chuỗi ký tự (string input)
  • Một số thao tác cơ bản với chuỗi ký tự

Tổng quan về chuỗi ký tự (std::string)

Bạn đã được tiếp xúc với chuỗi ký tự (string) ngay từ bài học C++ đầu tiên qua chương trình kinh điển bên dưới:

#include 
using namespace std;

int main()
{
	cout << "Hello, HowKteam.com!" << endl;
	return 0;
}

Chuỗi ký tự là tập hợp các ký tự được đặt trong dấu ngoặc kép. Dùng để biểu diễn những thông báo, văn bản, … trong chương trình. Trong chương trình trên, "Hello, HowKteam.com!" chính là một chuỗi ký tự.

Trong C++, kiểu chuỗi ký tự không được xây dựng sẵn (không phải là “built-in string”) mà được cài đặt trong một lớp của thư viện chuẩn STL (C++ Standard Template Library).


Khai báo, khởi tạo và gán giá trị một chuỗi ký tự

Để sử dụng chuỗi trong C ++, bạn cần phải #include thư viện string thuộc namespace std.

#include 
// …
std::string strMyName;

Bạn có thể sử dụng namespace std để có thể sử dụng string một cách ngắn gọn hơn:

#include 
using namespace std;
// …
string strMyName;

Tương tự như các biến thông thường, bạn có thể khởi tạo hoặc gán giá trị cho biến string theo nhiều cách:

/* Khai báo một chuỗi ký tự */
std::string strString;

/* Khởi tạo một chuỗi theo nhiều cách */
string strString0("");                 // Khởi tạo chuỗi strString0 rỗng
string strString1("Kteam");            // Khởi tạo chuỗi "Kteam" cho strString1
string strString2{ "Free Education!" }; // Khởi tạo chuỗi "Kteam" cho strString2
string strString3 = "HowKteam.com";    // Khởi tạo chuỗi "HowKteam.com" cho strString3
string strString4 = strString1;         // Gán giá trị chuỗi strString1 cho strString4

/* Khởi tạo một chuỗi số */
string strNumber = "88";         // Khởi tạo chuỗi "88" cho strNumber, không phải số

Chú ý: Khi khởi tạo giá trị là số cho một chuỗi, chuỗi đó không được coi là một số, và không có những thao tác như một biến số học ( cộng, trừ, nhân, chia …). C++ không tự động chuyển một chuỗi số về giá trị số nguyên (integer) hoặc số chấm động (floating point).


Xuất một chuỗi ký tự (string output):

Ở bài NHẬP & XUẤT DỮ LIỆU TRONG C++ (Input and Output), bạn đã biết cách nhập xuất dữ liệu trong C++. Đối với chuỗi ký tự, thao tác xuất cũng tương tự:

#include 
#include 
using namespace std;

int main()
{
     /* Khởi tạo một chuỗi HowKteam.com cho biến strString */
     string strString("HowKteam.com");

     /* Xuất chuỗi HowKteam.com lên console */
     cout << strString << endl;

     return 0;
}

Outputs:

 

Nhập chuỗi ký tự C++


Nhập một chuỗi ký tự (string input)

Đối với các kiểu dữ liệu cơ bản, bạn sử dụng đối tượng std::cin để đọc một thông tin nào đó từ thiết bị nhập chuẩn (mặc định là bàn phím), sau đó lưu thông tin đó vào một biến.

Cùng thử với kiểu dữ liệu std::string:

#include 
#include 
using namespace std;

int main()
{
       cout << "Enter your full name: ";
       string strName;
       cin >> strName;

       cout << "Enter your age: ";
       string strAge;
       cin >> strAge;

       cout << "Your name is " << strName << endl;
       cout << "Your age is " << strAge << endl;

       return 0;
}

Outputs:

Nhập chuỗi ký tự C++

Trong chương trình trên, khi nhập chuỗi “Hello HowKteam.com! Free Education!” và nhấn enter, chương trình đã bỏ qua lần nhập tiếp theo và xuất ra kết quả.

Chú ý: Toán tử >> (extraction operator) được dùng chung với std::cin chỉ cho phép đọc một dãy gồm các ký tự liền nhau (không có khoảng trắng), nên nó sẽ trả về các ký tự đến khoảng trắng đầu tiên trong chuỗi vừa nhập.

Vì vậy, chương trình có 2 lần yêu cầu nhập chuỗi, nhưng khi bạn nhập một chuỗi có 3 khoảng trắng như trên, nó chỉ cho phép bạn nhập vào 1 lần.


Nhập văn bản bằng std::getline()

Để đọc đầy đủ chuỗi có khoảng trắng từ đối tượng nhập của lớp iostream (ví dụ cin), bạn nên sử dụng hàm std::getline() (trong namespace std)

Ví dụ:

#include 
#include 
using namespace std;

int main()
{
       cout << "Enter your full name: ";
       string strName;
       getline(cin, strName);

       cout << "Enter your age: ";
       string strAge;
       getline(cin, strAge);

       cout << "Your name is " << strName << endl;
       cout << "Your age is " << strAge << endl;

       return 0;
}

Outputs:

Nhập chuỗi ký tự C++

Ở chương trình trên, bạn đã nhập được chuỗi ký tự bao gồm cả khoảng trắng với hàm std::getline().


Kết hợp giữ std::cin và std::getline() sẽ gây ra kết quả không mong muốn

Ví dụ:

#include 
#include 
using namespace std;

int main()
{
       cout << "Enter your age: ";
       int nAge;
       cin >> nAge;

       cout << "Enter your name: ";
       string strName;
       getline(cin, strName);

       cout << "Hello, " << strName << endl;
       cout << "Your age " << nAge << endl;    
       
       return 0;
}

Outputs:

Nhập chuỗi ký tự C++

Khi bạn nhập một thông tin bất kỳ, mọi ký tự bạn gõ vào bàn phím (kể cả ký tự Enter 

#include 
// …
std::string strMyName;
3) đều được đẩy vào bộ nhớ đệm trước khi được gán vào biến.

Trong chương trình trên, bạn nhập số bằng std:: cin, chúng chỉ nhận số chứ không nhận được ký tự Enter (‘\n’), và ký tự Enter vẫn còn trong bộ nhớ đệm. Đến khi nhập chuỗi, hàm std::getline() nhận được ký tự Enter từ bộ nhớ đệm thì kết thúc nhập và chương trình vẫn chạy tiếp. Điều này khiến kết quả bị sai.

Bạn có thể xóa ký tự Enter ‘\n’ sau khi sử dụng std::cin bằng cách sử dụng phương thức cin.ignore() thuộc namespace std:

// Xóa khỏi bộ nhớ đệm 32767 ký tự, hoặc đến khi gặp ký tự '\n'
std::cin.ignore(32767, '\n');

Ví dụ:

#include 
#include 
using namespace std;

int main()
{
       cout << "Enter your age: ";
       int nAge;
       cin >> nAge;

       // Xóa khỏi bộ nhớ đệm 32767 ký tự, hoặc đến khi gặp ký tự '\n'
       std::cin.ignore(32767, '\n');

       cout << "Enter your name: ";
       string strName;
       getline(cin, strName);

       cout << "Hello, " << strName << endl;
       cout << "Your age " << nAge << endl;    

       return 0;
}

Outputs:

Nhập chuỗi ký tự C++

Chú ý: Nên xóa ký tự Enter ‘\n’ trong bộ nhớ đệm trước khi nhập chuỗi bất kỳ.


Nhập một văn bản bao gồm ký tự xuống dòng

Mặc định, hàm std::getline() sử dụng ký tự ‘\n’ khi nhấn phím Enter là ký tự báo hiệu kết thúc việc nhập chuỗi.

Nếu muốn nhập nhiều dòng văn bản vào một biến string, bạn có thể thay đổi nó, ví dụ:

#include 
// …
std::string strMyName;
0

Outputs:

Nhập chuỗi ký tự C++

Trong chương trình trên, bạn có thể nhập chuỗi ký tự cho đến khi chương trình nhận vào ký tự gạch dưới ‘_’. Kết quả nhận được là một chuỗi ký tự gồm nhiều dòng.


Một số thao tác cơ bản với chuỗi ký tự

Nối chuỗi (Appending strings)

Bạn có thể sử dụng toán tử + để nối hai chuỗi với nhau, hoặc toán tử += để nối thêm một chuỗi khác.

Ví dụ:

#include 
// …
std::string strMyName;
1

Outputs:

Nhập chuỗi ký tự C++

Chú ý: Khi nối chuỗi, lưu ý là 2 chuỗi số được nối lại với nhau, không phải cộng 2 giá trị số.


Độ dài chuỗi ký tự (String length)

Lớp string định nghĩa cho chúng ta 2 phương thức để thực hiện việc lấy ra độ dài của chuỗi kí tự.

Ví dụ:

#include 
// …
std::string strMyName;
2

Outputs:

Nhập chuỗi ký tự C++


Kết luận

Qua bài học này, bạn đã nắm được Cơ bản về chuỗi ký tự trong C++ ( std::string ). Std::string là tương đối phức tạp, và còn nhiều tính năng khác mà bạn chưa cần phải biết đến tại thời điểm này. Bạn sẽ được hướng dẫn kỹ hơn ở những bài học sau.

Ở bài tiếp theo, bạn sẽ được học về BIẾN CỤC BỘ & TẦM VỰC CỦA BIẾN TRONG C++ (Variable scope)

Cảm ơn các bạn đã theo dõi bài viết. Hãy để lại bình luận hoặc góp ý của mình để phát triển bài viết tốt hơn. Đừng quên “Luyện tập – Thử thách – Không ngại khó”.


Thảo luận

Nếu bạn có bất kỳ khó khăn hay thắc mắc gì về khóa học, đừng ngần ngại đặt câu hỏi trong phần BÌNH LUẬN bên dưới hoặc trong mục HỎI & ĐÁP trên thư viện Howkteam.com để nhận được sự hỗ trợ từ cộng đồng.