按照指定配置生成excel随机数据表格

完成大我 发表于 2024-7-8 18:03

本帖最后由完成大我于 2024-7-8 18:08 编辑

研发组里的BI小姐姐需要造测试数据，花了半小时写了这个按照指定配置生成excel随机数据表格的脚本，分享给需要的人。
1.脚本：#!/usr/bin/env python
# -*- coding: UTF-8 -*-

import pandas as pd
import numpy as np
import json
import string
import secrets
# 定义生成随机字符串的函数
def generate_random_string(length):
letters = string.ascii_letters# 包含大小写字母的字符串
return ''.join(secrets.choice(letters) for _ in range(length))

def random_split_float(total, n):
# 生成 n-1 个随机小数并保留两位小数
random_floats = np.round(np.random.rand(n - 1) * total, 2)
# 计算这些随机小数的和
sum_of_floats = np.sum(random_floats)
# 计算最后一个小数
last_value = np.round(total - sum_of_floats, 2)

# 如果最后一个小数小于0或大于总数（极端情况），重新生成
while last_value < 0 or last_value > total:
   random_floats = np.round(np.random.rand(n - 1) * total, 2)
   sum_of_floats = np.sum(random_floats)
   last_value = np.round(total - sum_of_floats, 2)

# 将最后一个小数加入数组
random_floats = np.append(random_floats, last_value)
return random_floats

def random_split(total, n):
# 生成 n-1 个随机点
split_points = sorted(np.random.randint(1, total, n-1))
# 将起始点和结束点加入切分点
split_points = + split_points +
# 计算每段的值
segments = - split_points for i in range(n)]
return segments
def genExcel():
# 自定义列字段
with open('config.json', 'r') as f:
   dataj = json.load(f)
allcolumn = for column in dataj['columns']]
# 随机生成N行数据
N = dataj["number"]# 生成N行数据
data = {}
for column in dataj["columns"]:
   if(column["type"] == 0):
         data] = np.random.choice(column["valueArea"], N)
   if(column["type"] == 1):
         data] = np.random.randint(column["valueArea"], column["valueArea"], N)
   if (column["type"] == 2):
         data] = np.round(np.random.uniform(column["valueArea"], column["valueArea"], N),2)
   if(column["type"] == 3):
         if(type(column["length"]) == int):
            data] = ) for _ in range(N)]
         else:
            data] = , column["length"])) for _ in range(N)]
   if(column["type"] == 4):
         emum = dataj["enums"]]
         data] = []
         for i in range(N):
            for item in emum:
               if(data] == item["value"]):
                     data].append(np.random.choice(item["children"]))
   if(column["type"] == 5):
         data] = np.round(np.random.uniform(column["valueArea"], column["valueArea"], N),2)
         for i in range(len(column["parameters"])):
            allcolumn.append(column["parameters"])
            data] = []
         for i in range(N):
            paramlist = random_split_float(data],len(column["parameters"]))
            for j in range(len(column["parameters"])):
               data].append(paramlist)
# 创建DataFrame

df = pd.DataFrame(data, columns=allcolumn)
# 将DataFrame写入Excel文件
df.to_excel('random_data.xlsx', index=False)

2.json配置文件：
{
"columns": [
{
   "name":"id",
   "type": 3,
   "length": 32
},
{
   "name":"NickName",
   "type": 3,
   "length":
},
{
   "name":"Name",
   "type": 0,
   "valueArea": [
   "Alice", "Bob", "Charlie", "David", "Eva"
   ]
},
{
   "name":"Age",
   "type": 1,
   "valueArea":
},
{
   "name":"City",
   "type": 0,
   "valueArea": [
   "Alice", "Bob", "Charlie", "David", "Eva"
   ]
},
{
   "name":"Salary",
   "type": 2,
   "valueArea":
},
{
   "name":"Street",
   "type": 4,
   "parent": "City"
},
{
   "name":"sum",
   "type": 5,
   "parameters": ["x","y","z"],
   "valueArea":
}
],
"number": 1000,
"enums": {
"City":[
   {
   "value": "Alice",
   "children": ["a","b","c"]
   },
   {
   "value": "Bob",
   "children": ["d","e","f"]
   },
   {
   "value": "Charlie",
   "children": ["g","h","i"]
   },
   {
   "value": "David",
   "children": ["j","k","l"]
   },
   {
   "value": "Eva",
   "children": ["m","n","o"]
   }
]
}
}
3.配置规则说明：

type规则说明备注
0 随机字符串，从指定的字典里随机取一个字符串，参考json文件案例
1 随机整数，从指定的数值范围内随机取一个整数
2 随机小数，从指定的数值范围内随机取一个小数
3 随机长度随机字符串，根据指定的长度范围，随机生成字符串，如果length是一个整数，则生成指定长度随机字符串
4 随机关联关系，parent指定父字段，只能是0类型，enums重配置父类型每个取值关联的值范围，比如代码案例配置文件中，父字段是City，某一行取值是Alice，那Street字段，这一行取值的范围就是a/b/c中随机
5 随机数值分解，name定义总和的字段名，parameters定义分解字段名，valueArea定义总和的取值范围，随机生成取值范围内的值（保留2位小数），然后随机拆分成分解字段的几个值之和（保留2位小数）
4.脚本文件

醉酒听风 发表于 2024-7-9 10:05

可以可以，不错的工具，可以研究研究

EssenceA1 发表于 2024-7-9 10:42

支持一下，是不是可以用作随机化工具

cxj132 发表于 2024-7-9 23:22

看一下怎么用，赞

cld61 发表于 2024-7-10 09:36

这个json配置文件是怎么生成的，楼主帮忙讲一下嘛

完成大我 发表于 2024-7-10 09:58

cld61 发表于 2024-7-10 09:36
这个json配置文件是怎么生成的，楼主帮忙讲一下嘛

{:301_1009:}配置文件要自己填啊，就是按照json配置文件的规则去生成excel随机数据的

cld61 发表于 2024-7-10 10:14

完成大我发表于 2024-7-10 09:58
配置文件要自己填啊，就是按照json配置文件的规则去生成excel随机数据的

这json里边内容全手敲的嘛？看着配置选项挺多，有什么简单的方法做这个配置吗

yutao666 发表于 2024-7-10 16:12

很好，感谢

cooltnt 发表于 2024-7-15 14:24

用过一个在线模拟数据工具，非常不错https://mockaroo.com/

页: [1]

吾爱破解 - 52pojie.cn's Archiver

按照指定配置生成excel随机数据表格