
本文共 1915 字,大约阅读时间需要 6 分钟。
在处理Pandas数据时,经常会遇到需要根据嵌套列表列表创建动态列的情况。这个问题可以通过结合使用`pd.json_normalize()`函数和一些额外的操作来解决。下面是一个详细步骤和代码示例:
### 1. 导入所需的库
首先,确保你的环境中已经安装了pandas库。如果尚未安装,可以使用以下命令进行安装:
```python
pip install pandas ```### 2. 准备数据
假设我们有一个包含嵌套列表列表的Pandas DataFrame,其结构如下:
```plaintext
name hobbies 0 Alice [read, write] 1 Bob [draw] 2 Charlie [play, travel] ```### 3. 使用`pd.json_normalize()`来展开嵌套列表
`pd.json_normalize()`函数能够将JSON格式的嵌套数据转换为列。在这个例子中,我们将使用它来展开`hobbies`列:
```python
import pandas as pd# 创建示例DataFrame
data = { "name": ["Alice", "Bob", "Charlie"], "hobbies": [["read", "write"], ["draw"], ["play", "travel"]] } df = pd.DataFrame(data)# 使用pd.json_normalize()展开嵌套列表
expanded_df = pd.json_normalize(df, 'hobbies')print(expanded_df)
```### 4. 重命名和重塑DataFrame
为了使列名称更清晰,我们可以给新添加的列添加前缀,并调整DataFrame的结构以匹配原始数据结构:
```python
# 重命名列 expanded_df = expanded_df.add_prefix('hobby_')# 重塑DataFrame
result_df = pd.concat([df.drop('hobbies', axis=1), expanded_df], axis=1)print(result_df)
```### 5. 输出结果
运行上述代码后,你将得到一个包含原始列和新展开的列表动态列的新DataFrame:
```plaintext
name hobby_0 hobby_1 0 Alice read write 1 Bob draw NaN 2 Charlie play travel ```### 测试用例
为了验证上述代码的正确性,我们可以编写一个测试用例来检查结果是否与预期相符:
```python
def test_expand_hobbies(): test_data = { "name": ["Alice", "Bob", "Charlie"], "hobbies": [["read", "write"], ["draw"], ["play", "travel"]] } test_df = pd.DataFrame(test_data) expected_columns = ['name', 'hobby_0', 'hobby_1']result_df = expand_hobbies(test_df)
actual_columns = list(result_df.columns)assert set(expected_columns) == set(actual_columns), "测试失败:列名不正确。"
# 假设expand_hobbies是一个函数,用于执行上述操作
expand_hobbies = lambda df: pd.concat([df.drop('hobbies', axis=1), pd.json_normalize(df, 'hobbies').add_prefix('hobby_')], axis=1)test_expand_hobbies()
print("测试通过!") ```### 人工智能大模型应用场景
这个例子展示了如何在Python中使用pandas和人工智能大模型来解决一个具体问题。例如,如果你的数据中包含用户对多个产品的偏好(以嵌套列表形式表示),你可以使用Pandas来展开这些列表并分析用户的行为模式。然后,你可以利用机器学习算法或人工智能大模型来发现潜在的市场趋势或推荐产品给用户。python
发表评论
最新留言
关于作者
