【C++】map & set

avatar
作者
猴君
阅读量:0

文章目录


在这里插入图片描述

1. 关联式容器

我们前面接触过 STL 中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?

关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是 <key, value> 结构的键值对,在数据检索时比序列式容器效率更高

2. 键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量 key 和 value,key 代表键值,value 表示与 key 对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应关系,即通过该英文单词,在词典中就可以找到与其对应的中文含义。

SGI-STL 中关于键值对的定义:

template <class T1, class T2> struct pair { 	typedef T1 first_type; 	typedef T2 second_type; 	 	T1 first; 	T2 second; 	 	pair() : first(T1()), second(T2()) 	{} 	 	pair(const T1& a, const T2& b) : first(a), second(b) 	{} }; 

3. 树形结构的关联式容器

根据应用场景的不同,STL 总共实现了两种不同结构的关联式容器:树形结构与哈希结构。树形结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为底层结构,容器中的元素是一个有序的序列。下面依次介绍每一个容器。

3.1 set

3.1.1 set 的介绍

set 文档介绍

翻译:

  1. set 是按照一定次序存储元素的容器。
  2. 在 set 中,元素的 value 也标识它(value 就是 key,类型为 T),并且每个 value 必须是唯一的。set 中的元素不能在容器中修改(元素总是 const),但是可以从容器中插入或删除它们。
  3. 在内部,set 中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set 容器通过 key 访问单个元素的速度通常比 unordered_set 容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set 在底层是用二叉搜索树(红黑树)实现的。

注意:

  1. 与 map / multimap 不同,map / multimap 中存储的是真正的键值对 <key, value>,set 中只放 value,但在底层实际存放的是由 <value, value> 构成的键值对。
  2. set 中插入元素时,只需要插入 value 即可,不需要构造键值对。
  3. set 中的元素不可以重复(因此可以使用 set 进行去重)。
  4. 使用 set 的迭代器遍历 set 中的元素,可以得到有序序列。
  5. set 中的元素默认按照小于来比较。
  6. set 中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
  7. set 中的元素不允许修改。
  8. set 中的底层使用二叉搜索树(红黑树)来实现。

3.1.2 set 的使用

  1. set 的模板参数列表

    在这里插入图片描述

    T:set 中存放元素的类型,实际在底层存储 <value, value> 的键值对。

    Compare:set 中元素默认按照小于来比较。

    Alloc:set 中元素空间的管理方式,使用 STL 提供的空间配置器管理。

  2. set 的构造

    函数声明功能介绍
    set ( const Compare& comp = Compare(), const Allocator& = Allocator() );构造空的 set
    set ( InputIterator first, InputIterator last, const Compare& comp = Compare(), const Allocator& = Allocator() );用 [first, last) 区间中的元素构造 set
    set ( const set<Key, Compare, Allocator>& x );set 的拷贝构造
  3. set 的迭代器

    函数声明功能介绍
    iterator begin()返回 set 中起始位置元素的迭代器
    iterator end()返回 set 中最后一个元素后面的迭代器
    const_iterator cbegin() const返回 set 中起始位置元素的 const 迭代器
    const_iterator cend() const返回 set 中最后一个元素后面的 const 迭代器
    reverse_iterator rbegin()返回 set 第一个元素的反向迭代器,即 end
    reverse_iterator rend()返回 set 最后一个元素下一个位置的反向迭代器,即 rbegin
    const_reverse_iterator crbegin() const返回 set 第一个元素的反向 const 迭代器,即 cend
    const_reverse_iterator crend() const返回 set 最后一个元素下一个位置的反向 const 迭代器,即 crbegin
  4. set 的容量

    函数声明功能介绍
    bool empty() const检测 set 是否为空,空返回 true,否则返回 false
    size_type size() const返回 set 中有效元素的个数
  5. set 修改操作

    函数声明功能介绍
    pair<iterator, bool> insert ( const value_type& x )在 set 中插入元素 x,实际插入的时 <x, x> 构成的键值对,如果插入成功,返回 <该元素在 set 中的位置, true>,如果插入失败,说明 x 在 set 中已经存在,返回 <x 在 set 中的位置, false>
    void erase ( iterator position )删除 set 中 position 位置上的元素
    size_type erase ( const key_type& x )删除 set 中值为 x 的元素,返回删除的元素个数
    void erase ( iterator first, iterator last )删除 set 中 [first, last) 区间中的元素
    void swap ( set<Key, Compare, Allocator>& st )交换 set 中的元素
    void clear ()将 set 中的元素清空
    iterator find ( const key_type& x ) const返回 set 中值为 x 的元素的位置
    size_type count ( const key_type& x ) const返回 set 中值为 x 的元素的个数
  6. set 的使用举例

    #include <set>  void TestSet() { 	// 用数组array中的元素构造set 	int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 }; 	set<int> s(array, array + sizeof(array) / sizeof(array[0])); 	cout << s.size() << endl; 	 	// 正向打印set中的元素,从打印结果中可以看出:set可去重 	for (auto& e : s) 		cout << e << " "; 	cout << endl; 	 	// 使用迭代器逆向打印set中的元素 	for (auto it = s.rbegin(); it != s.rend(); ++it) 		cout << *it << " "; 	cout << endl; 	 	// set中值为3的元素出现了几次 	cout << s.count(3) << endl; } 

3.2 map

3.2.1 map 的介绍

map 文档介绍

翻译:

  1. map 是关联容器,它按照特定的次序(按照 key 来比较)存储由键值 key 和值 value 组合而成的元素。

  2. 在 map 中,键值 key 通常用于排序和唯一的标识元素,而值 value 中存储与此键值 key 关联的内容。键值 key 和值 value 的类型可能不同,并且在 map 的内部,key 与 value 通过成员类型 value_type 绑定在一起,为其取别名称为 pair:

    typedef pair<const key, T> value_type;

  3. 在内部,map 中的元素总是按照键值 key 进行比较排序的。

  4. map 中通过键值访问单个元素的速度通常比 unordered_map 容器慢,但 map 允许根据顺序对元素进行直接迭代(即对 map 中的元素进行迭代时,可以得到一个有序的序列)。

  5. map 支持下标访问符,即在 [] 中放入 key,就可以找到与 key 对应的 value。

  6. map 通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

3.2.2 map 的使用

  1. map 的模板参数说明

    在这里插入图片描述

    key:键值对中 key 的类型

    T:键值对中 value 的类型

    Compare:比较器的类型,map 中的元素是按照 key 来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)。

    Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器。

    注意:在使用 map 时,需要包含头文件。

  2. map 的构造

    函数声明功能介绍
    map()构造一个空的 map
  3. map 的迭代器

    函数声明功能介绍
    begin() 和 end()begin:首元素的位置,end:最后一个元素的下一个位置
    cbegin() 和 cend()与 begin 和 end 意义相同,但 cbegin 和 cend 所指向的元素不能修改
    rbegin() 和 rend()反向迭代器,rbegin 在 end 位置,rend 在 begin 位置,其 ++ 和 – 操作与 begin 和 end 操作移动相反
    crbegin() 和 crend()与 rbegin 和 rend 位置相同,操作相同,但 crbegin 和 crend 所指向的元素不能修改
  4. map 的容量与元素访问

    函数声明功能简介
    bool empty () const检测 map 中的元素是否为空,是返回 true,否则返回 false
    size_type size () const返回 map 中有效元素的个数
    mapped_type& operator[] (const key_type& k)返回 key 对应的 value

    问题:当 key 不在 map 中时,通过 operator 获取对应 value 时会发生什么问题?

    在这里插入图片描述

    注意:在元素访问时,有一个与 operator[] 类似的操作 at()(该函数不常用)函数,都是通过 key 找到与 key 对应的 value 然后返回其引用,不同的是:当 key 不存在时,operator[] 用默认 value 与 key 构造键值对然后插入,返回该默认 value,at() 函数直接抛异常

  5. map 中元素的修改

    函数声明功能简介
    pair<iterator, bool> insert ( const value_type& x )在 map 中插入键值对 x,注意 x 是一个键值对,返回值也是键值对:iterator 代表新插入元素的位置,bool 代表释放插入成功
    void erase ( iterator position )删除 position 位置上的元素
    size_type erase ( const key_type& x )删除键值为 x 的元素
    void erase ( iterator first, iterator last )删除 [first, last) 区间中的元素
    void swap ( map<Key, T, Compare, Allocator>& mp )交换两个 map 中的元素
    void clear ()将 map 中的元素清空
    iterator find ( const key_type& x )在 map 中插入 key 为 x 的元素,找到返回该元素的位置的迭代器,否则返回 end
    const_iterator find ( const key_type& x ) const在 map 中插入 key 为 x 的元素,找到返回该元素的位置的 const 迭代器,否则返回 cend
    size_type count ( const key_type& x ) const返回 key 为 x 的键值在 map 中的个数,注意 map 中 key 是唯一的,因此该函数的返回值要么为 0,要么为 1,因此也可以用该函数来检测一个 key 是否在 map 中
    #include <string> #include <map>  void TestMap() { 	map<string, string> m; 	 	// 向map中插入元素的方式: 	// 将键值对<"peach","桃子">插入map中,用pair直接来构造键值对 	m.insert(pair<string, string>("peach", "桃子")); 	 	// 将键值对<"peach","桃子">插入map中,用make_pair函数来构造键值对 	m.insert(make_pair("banan", "香蕉")); 	 	// 借用operator[]向map中插入元素 	/* 	operator[]的原理是: 		用<key, T()>构造一个键值对,然后调用insert()函数将该键值对插入到map中 		如果key已经存在,插入失败,insert函数返回该key所在位置的迭代器 		如果key不存在,插入成功,insert函数返回新插入元素所在位置的迭代器 		operator[]函数最后将insert返回值键值对中的value返回 	*/ 	// 将<"apple", "">插入map中,插入成功,返回value的引用,将“苹果”赋值给该引用结果, 	m["apple"] = "苹果"; 	 	// key不存在时抛异常 	//m.at("waterme") = "水蜜桃"; 	cout << m.size() << endl; 	 	// 用迭代器去遍历map中的元素,可以得到一个按照key排序的序列 	for (auto& e : m) 		cout << e.first << "--->" << e.second << endl; 	cout << endl; 	 	// map中的键值对key一定是唯一的,如果key存在将插入失败 	auto ret = m.insert(make_pair("peach", "桃色")); 	if (ret.second) 		cout << "<peach, 桃色>不在map中, 已经插入" << endl; 	else 		cout << "键值为peach的元素已经存在:" << ret.first->first << "--->" 		<< ret.first->second << " 插入失败" << endl; 		 	// 删除key为"apple"的元素 	m.erase("apple"); 	 	if (1 == m.count("apple")) 		cout << "apple还在" << endl; 	else 		cout << "apple被吃了" << endl; } 

【总结】

  1. map 中的元素是键值对;
  2. map 中的 key 是唯一的,并且不能修改;
  3. 默认按照小于的方式对 key 进行比较;
  4. map 中的元素如果用迭代器去遍历,可以得到一个有序的序列;
  5. map 的底层为平衡搜索树(红黑树),查找效率比较高 O ( l o g 2 N ) O(log_2 N) O(log2N)
  6. 支持 [] 操作符,operator[] 中实际进行插入查找。

3.3 multiset

3.3.1 multuset 的介绍

mulitset 文档介绍

翻译:

  1. mulitset 是按照特定顺序存储元素的容器,其中元素是可以重复的。
  2. 在 multiset 中,元素的 value 也会识别它(因为 multiset 中本身存储的就是 <value, value> 组成的键值对,因此 value 本身就是 key,key 就是 value,类型为 T)。multiset 元素的值不能在容器中进行修改(因为元素总是 const 的),但可以从容器中插入或删除。
  3. 在内部,multiset 中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
  4. multiset 容器通过 key 访问单个元素的速度通常比 unordered_multiset 容器慢,但当使用迭代器遍历时会得到一个有序序列。
  5. multiset 底层结构为二叉搜索树(红黑树)。

注意:

  1. multiset 中在底层中存储的是 <value, value> 的键值对。
  2. multiset 的插入接口中只需要插入即可。
  3. 与 set 的区别是:multiset 中的元素可以重复,set 中 value 是唯一的。
  4. 使用迭代器对 multiset 中的元素进行遍历,可以得到有序的序列。
  5. multiset 中的元素不能修改。
  6. 在 multiset 中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
  7. multiset 的作用:可以对元素进行排序。

3.3.2 multiset 的使用

此处值简单演示 set 与 multiset 的不同,其他接口与 set 相同。

#include <set>  void TestSet() { 	int array[] = { 2, 1, 3, 9, 6, 0, 5, 8, 4, 7, 1, 1, 2, 2, 2 }; 	// 注意:multiset在底层实际存储的是<int, int>的键值对 	multiset<int> s(array, array + sizeof(array) / sizeof(array[0])); 	for (auto& e : s) 		cout << e << " "; 	cout << endl; 	return; } 

3.4 multimap

3.4.1 multimap 的介绍

multimap 文档介绍

翻译:

  1. multimap 是关联式容器,它按照特定的顺序,存储由 key 和 value 映射成的键值对 <key, value>,其中多个键值对之间的 key 是可以重复的。

  2. 在 multimap 中,通常按照 key 排序和唯一的标识元素,而映射的 value 存储与 key 关联内容。key 和 value 的类型可能不同,通过 multimap 内部的成员类型 value_type 组合在一起,value_type 是组合 key 和 value 的键值对:

    typedef pair<const Key, T> value_type;

  3. 在内部,multimap 中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对 key 进行排序的。

  4. multimap 通过 key 访问单个元素的速度通常比 unordered_multimap 容器慢,但是使用迭代器直接遍历 multimap 中的元素可以得到关于 key 有序的序列。

  5. multimap 在底层用二叉搜索树(红黑树)来实现。

注意:multimap 和 map 的唯一不同就是:map 中的 key 是唯一的,而 multimap 中 key 是可以重复的。

3.4.2 multimap 的使用

multimap 中的接口可以参考 map,功能都是类似的。

注意:

  1. multimap 中的 key 是可以重复的。
  2. multimap 中的元素默认将 key 按照小于来比较。
  3. multimap 中没有重载 operator[] 操作。
  4. 使用时与 map 包含的头文件相同。

END

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!