您的位置: 网站首页> 大家问> 当前文章

cannot join with no overlapping index names

老董2022-05-01178围观,134赞

  最近在用pandas做数据加减法的时候碰到了1个问题,cannot join with no overlapping index names,一时没反应过来是怎么回事。仔细品味了一会后终于明白了。现在用代码来复现下这个问题(对pandas感兴趣的话可以关注>>系统的pandas教程)。

  1、先看1个正常的例子,二维索引的df取两个列(2个series)相加

  Series只有行索引,2个series相加,只要他们的索引呢个对齐即可

# -*- coding:UTF-8 -*-
import pandas as pd   

df = pd.DataFrame({
    'name1': list('aabb'), 'name2': list('efgh'), 
    'col1': [3, 3, 3, 3], 'col2':[4, 4, 4, 4]}).set_index(['name1', 'name2'])
print(df)
print('--------------------------------')
df['new'] = df['col1'] + df['col2']
print(df)
             col1  col2
name1 name2            
a     e         3     4
      f         3     4
b     g         3     4
      h         3     4
--------------------------------
             col1  col2  new
name1 name2                 
a     e         3     4    7
      f         3     4    7
b     g         3     4    7
      h         3     4    7

  2、继续看1个正常的例子,用行索引相同但是列索引不同的两个df相加

  下面例子因为第2个df没有col2列,所以df的col2相加时候默认是空值

# -*- coding:UTF-8 -*-
import pandas as pd   

df = pd.DataFrame({
    'name1': list('aabb'), 'name2': list('efgh'), 
    'col1': [3, 3, 3, 3], 'col2':[4, 4, 4, 4]}).set_index(['name1', 'name2'])

df2 = pd.DataFrame({
    'name1': list('aabb'), 'name2': list('efgh'), 
    'col1': [3, 3, 3, 3]}).set_index(['name1', 'name2'])
print(df2 + df)
             col1  col2
name1 name2            
a     e         6   NaN
      f         6   NaN
b     g         6   NaN
      h         6   NaN

  3、再看1个异常例子,用df和Series相加

# -*- coding:UTF-8 -*-
import pandas as pd   

df = pd.DataFrame({
    'name1': list('aabb'), 'name2': list('efgh'), 
    'col1': [3, 3, 3, 3], 'col2':[4, 4, 4, 4]}).set_index(['name1', 'name2'])

df2 = pd.DataFrame({
    'name1': list('aabb'), 'name2': list('efgh'), 
    'col1': [3, 3, 3, 3]}).set_index(['name1', 'name2'])
print(df2 + df['col1'])
raise ValueError("cannot join with no overlapping index names")
ValueError: cannot join with no overlapping index names

  为什么第3个例子报错了,因为Series的行索引和df一致,但是Series没有列索引。他只有name属性,也就是两者的索引对不上!所以报错cannot join with no overlapping index names(他们的索引没有重叠所以不能join到一起)。

很赞哦!

python编程网提示:转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部),获取技术资料请到公众号(底部)。同行交流请加群 python学习会

文章评论

    cannot join with no overlapping index names文章写得不错,值得赞赏

站点信息

  • 网站程序:Laravel
  • 客服微信:a772483200