5 Replies Latest reply on Jun 15, 2016 12:59 PM by manojdunna

Node cannot join cluster correctly after restart

maruta.s Oct 6, 2014 4:35 AM

Hello,

we are facing problem, that after some unexpected server restart, node is not able to join the cluster again.

Our environment is 2 node cluster (infinispan rest servers). One node1 (server) was restarted and after that it cannot join the cluster until second node (node2) was restarted:

Logs from node1:

After restart there are many errors regarding transactions:

Sep 29, 2014 3:03:53 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport stop

INFO: ISPN000080: Disconnecting and closing JGroups Channel

Sep 29, 2014 3:03:54 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport stop

INFO: ISPN000082: Stopping the RpcDispatcher

Sep 29, 2014 3:05:20 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport start

INFO: ISPN000078: Starting JGroups Channel

Sep 29, 2014 3:05:21 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport viewAccepted

INFO: ISPN000094: Received new cluster view: [LOUAPPWPS984-56770|15] [LOUAPPWPS984-56770, LOUAPPWPS983-56765]

Sep 29, 2014 3:05:21 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport startJGroupsChannelIfNeeded

INFO: ISPN000079: Cache local address is LOUAPPWPS983-56765, physical addresses are [133.27.18.204:7800]

Sep 29, 2014 3:05:21 AM org.infinispan.factories.GlobalComponentRegistry start

INFO: ISPN000128: Infinispan version: Infinispan 'Delirium' 5.2.6.Final

Sep 29, 2014 3:05:22 AM org.infinispan.factories.TransactionManagerFactory construct

INFO: ISPN000161: Using a batchMode transaction manager

Sep 29, 2014 3:05:22 AM org.infinispan.jmx.CacheJmxRegistration start

INFO: ISPN000031: MBeans were successfully registered to the platform MBean server.

Sep 29, 2014 3:05:23 AM org.infinispan.factories.TransactionManagerFactory construct

INFO: ISPN000161: Using a batchMode transaction manager

Sep 29, 2014 3:05:23 AM org.infinispan.jmx.CacheJmxRegistration start

INFO: ISPN000031: MBeans were successfully registered to the platform MBean server.

Sep 29, 2014 3:05:23 AM org.infinispan.factories.TransactionManagerFactory construct

INFO: ISPN000161: Using a batchMode transaction manager

Sep 29, 2014 3:05:23 AM org.infinispan.jmx.CacheJmxRegistration start

INFO: ISPN000031: MBeans were successfully registered to the platform MBean server.

Sep 29, 2014 3:06:18 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport viewAccepted

INFO: ISPN000094: Received new cluster view: [LOUAPPWPS983-56765|16] [LOUAPPWPS983-56765]

Sep 29, 2014 3:06:38 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport viewAccepted

INFO: ISPN000093: Received new, MERGED cluster view: MergeView::[LOUAPPWPS983-56765|17] [LOUAPPWPS983-56765, LOUAPPWPS984-56770], subgroups=[LOUAPPWPS984-56770|15] [LOUAPPWPS984-56770], [LOUAPPWPS983-56765|16] [LOUAPPWPS983-56765]

Sep 29, 2014 3:07:33 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport stop

INFO: ISPN000080: Disconnecting and closing JGroups Channel

Sep 29, 2014 3:07:33 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport stop

INFO: ISPN000082: Stopping the RpcDispatcher

Sep 29, 2014 3:08:45 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport start

INFO: ISPN000078: Starting JGroups Channel

Sep 29, 2014 3:08:46 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport viewAccepted

INFO: ISPN000094: Received new cluster view: [LOUAPPWPS984-56770|19] [LOUAPPWPS984-56770, LOUAPPWPS983-54866]

Sep 29, 2014 3:08:47 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport startJGroupsChannelIfNeeded

INFO: ISPN000079: Cache local address is LOUAPPWPS983-54866, physical addresses are [133.27.18.204:7800]

Sep 29, 2014 3:08:47 AM org.infinispan.factories.GlobalComponentRegistry start

INFO: ISPN000128: Infinispan version: Infinispan 'Delirium' 5.2.6.Final

Sep 29, 2014 3:08:47 AM org.infinispan.factories.TransactionManagerFactory construct

INFO: ISPN000161: Using a batchMode transaction manager

Sep 29, 2014 3:08:47 AM org.infinispan.jmx.CacheJmxRegistration start

INFO: ISPN000031: MBeans were successfully registered to the platform MBean server.

Sep 29, 2014 3:12:47 AM org.apache.catalina.core.ApplicationContext log

SEVERE: StandardWrapper.Throwable

org.infinispan.CacheException: Unable to invoke method public void org.infinispan.statetransfer.StateTransferManagerImpl.waitForInitialStateTransferToComplete() throws java.lang.InterruptedException on object of type StateTransferManagerImpl

at org.infinispan.util.ReflectionUtil.invokeAccessibly(ReflectionUtil.java:205)

at org.infinispan.factories.AbstractComponentRegistry$PrioritizedMethod.invoke(AbstractComponentRegistry.java:886)

at org.infinispan.factories.AbstractComponentRegistry.invokeStartMethods(AbstractComponentRegistry.java:657)

at org.infinispan.factories.AbstractComponentRegistry.internalStart(AbstractComponentRegistry.java:646)

at org.infinispan.factories.AbstractComponentRegistry.start(AbstractComponentRegistry.java:549)

at org.infinispan.factories.ComponentRegistry.start(ComponentRegistry.java:217)

at org.infinispan.CacheImpl.start(CacheImpl.java:582)

at org.infinispan.manager.DefaultCacheManager.wireAndStartCache(DefaultCacheManager.java:686)

at org.infinispan.manager.DefaultCacheManager.createCache(DefaultCacheManager.java:649)

at org.infinispan.manager.DefaultCacheManager.getCache(DefaultCacheManager.java:545)

at org.infinispan.rest.StartupListener$$anonfun$init$1.apply(StartupListener.scala:66)

at org.infinispan.rest.StartupListener$$anonfun$init$1.apply(StartupListener.scala:65)

at scala.collection.Iterator$class.foreach(Iterator.scala:727)

at scala.collection.AbstractIterator.foreach(Iterator.scala:1156)

at org.infinispan.rest.StartupListener.init(StartupListener.scala:65)

at org.apache.catalina.core.StandardWrapper.initServlet(StandardWrapper.java:1280)

at org.apache.catalina.core.StandardWrapper.loadServlet(StandardWrapper.java:1193)

at org.apache.catalina.core.StandardWrapper.load(StandardWrapper.java:1088)

at org.apache.catalina.core.StandardContext.loadOnStartup(StandardContext.java:5176)

at org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5460)

at org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:150)

at org.apache.catalina.core.ContainerBase.addChildInternal(ContainerBase.java:901)

at org.apache.catalina.core.ContainerBase.addChild(ContainerBase.java:877)

at org.apache.catalina.core.StandardHost.addChild(StandardHost.java:633)

at org.apache.catalina.startup.HostConfig.deployDirectory(HostConfig.java:1120)

at org.apache.catalina.startup.HostConfig$DeployDirectory.run(HostConfig.java:1678)

at java.util.concurrent.Executors$RunnableAdapter.call(Unknown Source)

at java.util.concurrent.FutureTask.run(Unknown Source)

at java.util.concurrent.ThreadPoolExecutor.runWorker(Unknown Source)

at java.util.concurrent.ThreadPoolExecutor$Worker.run(Unknown Source)

at java.lang.Thread.run(Unknown Source)

Caused by: org.infinispan.CacheException: Initial state transfer timed out for cache eu.ysoft.safeq.core.cache.entity.CacheableJobInfo_index on LOUAPPWPS983-54866

at org.infinispan.statetransfer.StateTransferManagerImpl.waitForInitialStateTransferToComplete(StateTransferManagerImpl.java:216)

at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

at sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)

at sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)

at java.lang.reflect.Method.invoke(Unknown Source)

at org.infinispan.util.ReflectionUtil.invokeAccessibly(ReflectionUtil.java:203)

... 30 more

....

Followed by :

Sep 29, 2014 4:29:06 AM org.infinispan.remoting.transport.jgroups.JGroupsTransport viewAccepted

INFO: ISPN000094: Received new cluster view: [LOUAPPWPS983-54866|20] [LOUAPPWPS983-54866]

Sep 29, 2014 4:29:07 AM org.jgroups.logging.JDKLogImpl warn