데이터 타입은 값의 종류를 의미한다. 자바스크립트의 모든 값은 데이터 타입을 갖는다.
데이터 타입(ES6 기준)
- 원시 타입
- 숫자 타입(number) : 숫자. 정수와 실수 구분 없이 하나의 타입만 존재.
- 문자열 타입(string) : 문자열
- 불리언 타입(boolean) : 논리적 참(true)과 거짓(false)
- undefined 타입 : var 키워드로 선언된 변수에 암묵적으로 할당되는 값.
- null 타입 : 값이 없다는 것을 의도적으로 명시할 때 사용하는 값
- 심벌 타입(symbol) : ES6에서 추가된 7번째 타입
- 객체 타입 : 객체, 함수, 배열 등
console.log(1 === '1') // false
숫자 1과 문자열 '1'은 전혀 다른 값이다.
생성한 목적과 용도가 다르므로 메모리에 저장되는 방식과 해석하는 방식도 다르다.
자바스크립트는 다른 언어와 다르게 하나의 숫자 타입만 존재한다.
ECMAScript에 따르면 숫자타입은 배정밀도 64비트 부동 소수점 형식을 따른다.
모든 수는 실수이며, 정수를 따로 표기하지 않음.
var inteager = 10; // 정수
var double = 10.12; // 실수
var negative = -20; // 음수
자바스크립트는 2진수, 8진수, 16진수를 위한 데이터 타입이 없기 때문에 모두 10진수로 해석된다.
var binary = 0b01000001; // 2진수
var octal = 0o101; // 8진수
var hex = 0x41; // 16진수
console.log(binary) // 65
console.log(octal) // 65
console.log(hex) // 65
console.log(binary === octal && octal === hex) // true
모든 수를 실수 처리하기 때문에 연산 결과도 실수다.
console.log(1 === 1.0) // true
console.log(4 / 2) // true
console.log(3 / 2) // true
숫자 타입은 추가적으로 무한대의 값을 표현할 수 있다.
- Infinity: 양의 무한대
- -Infinity: 음의 무한대
- NaN: 산술 연산 불가(not-a-number)
console.log(10 / 0) // Infinity
console.log(10 / -0) // -Infinity
console.log(1 * 'string') // NaN
NaN을 NAN, Nan, nan으로 표기하면 변수로 해석하기 때문에, 정확히 NaN으로 표기해야 한다.
var x = nan; // ReferenceError: nan is not defined
문자열은 텍스트 데이터를 나타내는 데 사용한다.
작은 따옴표(' '), 큰 따옴표(" "), 백틱(``)으로 텍스트를 감싸면 문자열로 표현할 수 있다. 기본적으로 작은 따옴표(' ')를 사용한다.
var string;
string = '문자열'
string = "문자열"
string = `문자열`
C와 Java와 다르게 자바스크립트의 문자열은 원시타입이며, 변경 불가능한 값이다.
ES6부터 템플릿 리터럴(Template Literal)이라 하는 문자열 표기법이 추가되었다.
템플릿 리터럴은
- 멀티라인 문자열
- 표현식 삽입
- 태그드 템플릿
등의 문자열 처리 기능을 제공한다.
템플릿 리터럴은 **백틱(``)**을 사용해 표현한다.
일반 문자열은 개행이 허용되지 않지만 이스케이프 시퀀스를 활용하면 개행 표현이 가능하다.
-
이스케이프 시퀀스
- \0 : Null
- \b : 백스페이스
- \f : 폼 피드(Form Feed) => 프린터를 출력할 경우 다음 페이지의 시작 지점으로 이동한다.
- \n : 개행(Line Feed) => 다음 행으로 이동
- \r : 개행(Carriage Return): 커서를 처음으로 이동
- \t : 탭(수평)
- \v : 탭(수직)
- \uXXXX : 유니코드, 예를 들어 '\u0041'은 'A', '\uD55C'는 '한'
- \' : 작은 따옴표
- \"" : 큰 따옴표
- \\ : 백슬래시
-
라인 피드와 캐리지 리턴
- 개행문자는 텍스트 한 줄이 끝남을 표시하는 문자 또는 문자열이다.
- 과거 타자기에서 커서를 제어하는 방식에서 유래
- 라인 피드(LF): 커서를 정지한 상태에서 종이를 한줄 올리는 방식
- 캐리지 리턴(CR): 종이를 움직이지 않고 커서를 맨 앞줄로 이동하는 방식
- 초창기 컴퓨터는 출력을 프린터로 수행했기 때문에 이러한 용어를 그대로 차용하였다.
- 현대의 컴퓨터에서는 운영체제에 따라 다른 체계의 개행 방식을 사용
- 윈도우 : CR + LF 로 새로운 줄을 나타냄.
- 유닉스 : LF로 새로운 줄을 나타냄.
- macOS : 과거엔 CR, 현재는 LF.
- 이러한 이유로 다른 운영체제에서 생성한 텍스트 파일을 인식하지 못하는 현상이 발생한다.
- Javascript에서는 일반적으로 LF(\n)을 사용해 개행한다.
이스케이프 시퀀스 사용 예시
var template = '<ul>\n\t<li><a href="#">Home</a></li>\n</ul>'
console.log(template);
<ul>
<li><a href="#">Home</a></li>
</ul>
템플릿 리터럴 내에서는 이스케이스 시퀀스를 사용하지 않고도 줄바꿈이 허용되며, 모든 공백도 있는 그대로 적용된다.
var template = `<ul>
<li><a href="#">Home</a></li>
</ul>`;
console.log(template);
<ul>
<li><a href="#">Home</a></li>
</ul>
문자열은 문자열 연산자 **+**를 사용해 연결할 수 있다. 피연산자 중 하나 이상이 문자열인 경우 문자열 연결 연산자로 동작한다.
var first = 'Jo';
var second = 'JunHyung';
// ES5
console.log('My name is ' + first + second); // My name is Jo JunHyung
템플릿 리터럴에서는 표현식 삽입을 통해 간단히 문자열을 삽입할 수 있다.
var first = 'Jo';
var second = 'JunHyung';
// ES6
console.log(`My name is ${first} ${second}`); // My name is Jo JunHyung
표현식으로 삽입하려면 $ { }으로 표현식을 감싼다. 평가 결과가 문자열이 아니더라도 문자열로 강제 변환되어 삽입된다.
console.log(`1 + 2 = ${1 + 2}`); // 1 + 2 = 3
console.log('1 + 2 = ${1 + 2}'); // 1 + 2 = ${1 + 2}
불리언 타입은 논리적 참, 거짓을 나타내는 true, false 이다.
var foo = true;
console.log(foo); // true
foo = false;
console.log(foo); // false
undefined 타입의 값은 undefined가 유일하다.
var 키워드로 선언한 변수는 암묵적으로 undefined로 초기화된다. 그 이후로 변수를 호출하면 undefined가 반환된다.
var foo;
console.log(foo); // undefined
undefined는 자바스크립트 엔진이 변수를 초기화할 때 사용하는 값이므로 할당할 값이 없을 때, null을 할당한다.
null 타입은 null이 유일하다.
null은 변수에 값이 없다는 것을 의도적으로 명시할 때 사용한다.
변수에 null을 할당하는 것은 변수가 이전에 참조하던 값을 더이상 참조하지 않겠다는 의미이다.
자바스크립트 엔진은 누구도 참조하지 않는 메모리 공간에 대해 가비지 콜렉션을 수행한다.
var foo = 'Lee';
// 이전 참조를 제거. foo 변수는 'Lee'를 참조하지 않는다.
// 유용하지는 않다. 변수 자체를 소멸시키는 것이 더 낫다.
foo = null;
함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다.
ES6에서 추가된 7번째 타입으로 변경 불가능한 원시타입의 값이다.
심벌 값은 다른 값과 중복되지 않는 유일한 값이다.
심벌은 Symbol 함수를 호출해 생성한다. 이때 생성된 심벌 값은 외부에 노출되지 않고 중복되지 않는 유일무이한 값이다.
var key = Symbol('key');
console.log(typeof key); // symbol
var obj = {};
obj[key] = 'value';
console.log(obj[key]) // value
앞서 언급한 6가지의 데이터 타입외의 모든 값은 객체 타입이다.
var score = 100;
- 컴퓨터는 100을 저장하기 위해 메모리 공간을 확보한 다음, 확보된 메모리에 숫자 값 100을 2진수로 저장한다.
- 자바스크립트 엔진은 데이터 타입에 따라 정해진 크기의 메모리 공간을 확보한다.
- score에 저장되는 값은 숫자 타입이므로 8바이트의 공간의 크기가 결정된다.
- 100을 이진수로 저장한다.
- score를 통해 숫자 값 100이 저장되어 있는 메모리공간의 선두 메모리 셀의 주소를 찾아간다.
- score는 숫자타입이기 때문에, 8바이트의 메모리 공간을 읽어 2진수를 읽어들인다.
메모리에서 읽어들인 2진수를 어떻게 해석할까?
모든 값은 데이터 타입을 가지기 때문에 2진수를 데이터 타입에 맞게 해석한다.
그러므로 자바스크립트의 모든 값은
- 값을 저장할 때 확보하는 메모리 공간의 크기
- 값을 참조할 때 한번에 읽어들여야 할 메모리 공간의 크기
- 메모리에서 읽어들인 2진수를 어떻게 해석할지 결정
를 판단하기 위해 데이터 타입이 필요하다.
자바스크립트는 어떤 방식으로 데이터 타입을 결정할까?
C나 자바 같은 정적 타입 언어는 사전에 데이터 타입을 선언해야 한다.
하지만 자바스크립트는 변수를 선언할 때 타입을 선언하지 않는다. 어떠한 데이터 타입의 값이라도 자유롭게 할당할 수 있다.
변수의 데이터 타입을 조사할 때 typeof
연산자를 이용해 확인할 수 있다.
var foo;
console.log(typeof foo); // undefined
foo = 3;
console.log(typeof foo) // number
foo = null;
console.log(typeof foo) // object
자바스크립트는 값을 할당하는 시점에 변수의 타입이 동적으로 결정되고 변수의 타입을 언제든지 자유롭게 변경 가능하다.
이러한 특징을 동적 타이핑이라 부른다.
동적 타입 언어는 데이터 타입에 대해 무감각해질 정도로 편리하다.
이러한 장점이 있는 반면에 다음과 같은 단점이 있다.
- 변수 값이 언제든 변경될 수 있기 때문에 변수 값을 추적하기 어려울 수 있다.
- 값에 변경에 의해 타입도 언제든지 변경될 수 있다.
- 개발자의 의도와 상관없이 자바스크립트 엔진에 의해 암묵적으로 타입이 자동 변환된다.
동적 타입언어는 유연성은 높지만, 신뢰성은 떨어진다.
따라서 자바스크립트에서 변수를 사용할 때 주의사항은 다음과 같다.
- 변수는 필요한 경우에 한해 제한적으로 사용한다.
- 변수의 유효 범위(스코프)를 최대한 좁게 만들어 변수의 부작용을 억제한다.
- 전역 변수는 최대한 사용하지 않도록 한다.
- 변수보다는 상수를 사용해 값의 변경을 억제한다.
- 변수의 이름은 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다.
코드는 개발자를 위한 문서이기 때문에, 사람이 이해할 수 있는 코드, 즉 가독성이 좋은 코드가 좋은 코드이다.