佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法

MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法

熱門標(biāo)簽:地方門戶網(wǎng)站 網(wǎng)站排名優(yōu)化 百度競價(jià)排名 Linux服務(wù)器 鐵路電話系統(tǒng) 服務(wù)外包 呼叫中心市場需求 AI電銷

有時(shí)候需要制造一些測試的數(shù)據(jù),以mysql官方給的測試庫為基礎(chǔ),插入十萬,百萬或者千萬條數(shù)據(jù)。利用一些函數(shù)和存儲(chǔ)過程來完成。

官方給的測試庫地址:https://github.com/datacharmer/test_db

導(dǎo)入官方的數(shù)據(jù)庫,做了一些簡化,留下了部門表,員工表和雇傭表三張表,去掉了外鍵關(guān)聯(lián)。因?yàn)槭菧y試數(shù)據(jù),日期的對應(yīng)關(guān)系不具備準(zhǔn)確性。

必要的函數(shù)

生成隨機(jī)字符串

RAND():生成0~1之間的隨機(jī)數(shù)

FLOOR:向下整數(shù) (FlOOR(1.2)=1)

CEILING 向上取整 (CEILING(1.2)=2)

substring:截取字符串

concat:字符串連接

CREATE DEFINER=`root`@`localhost` FUNCTION `rand_string`(n INT) RETURNS varchar(255) CHARSET latin1
BEGIN
	DECLARE chars_str 	varchar(100) DEFAULT 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
  DECLARE return_str 	varchar(255) DEFAULT '';
  DECLARE i INT DEFAULT 0;
  WHILE i  n DO
    SET return_str = concat(return_str,substring(chars_str , FLOOR(1 + RAND()*62 ),1));
    SET i = i +1;
  END WHILE;
  RETURN return_str;
END

查看自定義的所有函數(shù)

show function status

測試使用:

select rand_string(5);

生成隨機(jī)年月日字符串

生成一個(gè)指定時(shí)間段內(nèi)的隨機(jī)日期

SELECT
	date(
	from_unixtime( unix_timestamp( '2000-01-01' ) + floor( rand() * ( unix_timestamp( '2020-12-31' ) - unix_timestamp( '2000-01-01' ) + 1 ) ) ));

函數(shù):生成指定時(shí)間段內(nèi)的隨機(jī)日期

CREATE DEFINER=`root`@`localhost` FUNCTION `rand_date_string`(startDate varchar(255),endDate varchar(255)) RETURNS varchar(255) CHARSET latin1
BEGIN
  DECLARE return_str varchar(255) DEFAULT '';
	
	 SET return_str =date(
		from_unixtime( unix_timestamp( startDate ) 
				+ floor( rand() * ( unix_timestamp( endDate ) - unix_timestamp( startDate ) + 1 ) ) 
			)
	 );
  
  RETURN return_str;
END

測試使用:

select rand_date_string('2000-01-01','2020-12-31');
//結(jié)果
2001-09-10

存儲(chǔ)過程生成數(shù)據(jù)

給每個(gè)部門插入一百萬員工,那么員工表就有九百萬的數(shù)據(jù)。

CREATE DEFINER=`root`@`localhost` PROCEDURE `data`()
BEGIN
	
	DECLARE i INT DEFAULT 1;
	DECLARE j INT DEFAULT 0;
	DECLARE id INT DEFAULT 0;
	WHILE i  10 DO
			WHILE j  1000000 DO
				insert into employees_m (emp_no,birth_date,first_name,last_name,gender,hire_date) VALUES(
					id,rand_date_string('1970-01-01','1997-01-01'),rand_string(5),rand_string(5),'M',NOW());
				
				insert into dept_emp_m (emp_no,dept_no,from_date,to_date) values(
					 id,concat('d00',i),rand_date_string('1990-01-01','2020-12-31'),'2020-12-31');
					 
			SET j=j+1;  
			SET id=id+1;  
			END WHILE;
	SET j = 0;
	SET i=i+1;   
	END WHILE;

END

插入九百萬條數(shù)據(jù)大概用時(shí):4868s

上面的方式插入數(shù)據(jù)會(huì)很慢,可以將數(shù)據(jù)插入到內(nèi)存表,就是將表的存儲(chǔ)引擎修改為MEMORY這樣就會(huì)使用內(nèi)存去存儲(chǔ)數(shù)據(jù),會(huì)比直接插入到INNODB引擎的表中快很多,只不過就是沒有持久化,但是速度賊快,插入一千萬條數(shù)據(jù)大概需要時(shí)間: 1227.89s

附錄

修改表存儲(chǔ)引擎

ALTER TABLE dept_emp_m ENGINE=MEMORY;

調(diào)整內(nèi)存表的大小,修改配置文件

[mysqld]
max_heap_table_size = 2048M
tmp_table_size = 2048M

以上就是MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法的詳細(xì)內(nèi)容,更多關(guān)于MySQL 千萬條測試數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • MySQL循環(huán)插入千萬級(jí)數(shù)據(jù)
  • MySQL 千萬級(jí)數(shù)據(jù)量如何快速分頁
  • MySQL 快速刪除大量數(shù)據(jù)(千萬級(jí)別)的幾種實(shí)踐方案詳解
  • MySQL千萬級(jí)大數(shù)據(jù)SQL查詢優(yōu)化知識(shí)點(diǎn)總結(jié)
  • MySql 快速插入千萬級(jí)大數(shù)據(jù)的方法示例
  • MySQL如何快速的創(chuàng)建千萬級(jí)測試數(shù)據(jù)
  • MySQL分表實(shí)現(xiàn)上百萬上千萬記錄分布存儲(chǔ)的批量查詢設(shè)計(jì)模式詳解
  • MySQL 百萬級(jí)分頁優(yōu)化(Mysql千萬級(jí)快速分頁)
  • mysql千萬級(jí)數(shù)據(jù)大表該如何優(yōu)化?
  • Mysql limit 優(yōu)化,百萬至千萬級(jí)快速分頁 復(fù)合索引的引用并應(yīng)用于輕量級(jí)框架

標(biāo)簽:銅川 湘潭 崇左 蘭州 黃山 仙桃 衡水 湖南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    常德市| 沛县| 新野县| 咸阳市| 南投县| 堆龙德庆县| 富平县| 东方市| 临清市| 磐安县| 高阳县| 巩留县| 阳朔县| 临城县| 蕉岭县| 陇南市| 平度市| 宁陵县| 桂东县| 鲁甸县| 建昌县| 衡东县| 泸溪县| 鹤峰县| 龙州县| 三原县| 阳新县| 保山市| 临澧县| 浮梁县| 赤峰市| 雷山县| 池州市| 平谷区| 合川市| 常德市| 新疆| 荆门市| 外汇| 海宁市| 乳山市|